Как организовать разбивку по таймкодам текста из 30000 слов?

Question

Kungusto @Kungusto

Нейронные сети

Как организовать разбивку по таймкодам текста из 30000 слов?

Цель: делать таймкоды по субтитрам 30000 слов

Есть вот такой вот промпт:
"""
На основании транскрибации в формате SRT выполни следующее:

1. Раздели весь текст на 7–8 основных логических тем (только ключевые моменты, без мелких деталей).
2. Для каждой темы укажи время начала из субтитров.
3. Сформируй список таймкодов в формате:
0:15 — Оптимизация базы данных
1:05 — Масштабирование
2:42 — Итоги встречи

Требования:
- Используй только текст и таймкоды из транскрипции.
- Не добавляй вымышленные темы и не придумывай время.
- Объединяй близкие по смыслу части, выбирай только ключевые переходы тем.
- Время начала видео — первый субтитр, конец — время последнего.
- Никакие таймкоды не выходят за предел последнего субтитра.
- Если выходит длиннее — сокращай формулировки или объединяй схожие темы.
- Названия тем должны быть сжатыми, но отражать суть.
- Строго соблюдай формат:
00:00:00 Вступление
00:10:25 Проблемы с производительностью
00:21:10 Оптимизация базы данных
00:42:00 Принятое решение
01:02:40 Итоги совещания
"""

Вроде бы все хорошо идет на час-полтора-два, но на 4-х часах субтитров (те самые 30к слов), модель считывает обрабатывает только 2-3 часа в лучшем случае, при чем никаких ошибок не выдает, просто делает вид что видео закончилось. Тут проблема с длинной контекста или в чем может быть еще проблема?

Пытался бить на чанки - не помогло, из-за того, что каждый чанк без контекста понятия не имеет об общей картине и смысле текста, поэтому формулировки максимально туманные. Даже пытался организовать систему при которой уже обработанные чанки давали пересказ текста, который уже обработали, но погоды особо не сыграло.