Метод
sendMediaGroup правильный, но там есть определённая особенность:
в поле media должен быть указан массив с фото (видео) и поле caption должно быть
только у первого элемента массива.
Если указать caption для более чем одного элемента, то Телеграм будет отображать их только при нажатии на предварительный просмотр фотографии для каждой фотографии отдельно.