Для этого нужно как-то сопоставлять текст и фото. Оптимальным вариантом, на мой взгляд, является JSON файл, хранящий объект, в котором заданы соответствия
{
"имя фала": "Текст",
"имя фала": "Текст"
}
Далее все просто: получаете названия фото -> находите в json`е соответствующий текст -> отправляете.