Задать вопрос

Алексей Рясский

Бэкендер

0

вклад
6

вопросов
7

ответов
14%

решений

Информация

Местоположение: Россия

Наибольший вклад в теги

Все теги (11)

FFmpeg
- 5 ответов
- 1 вопрос
0 Вклад в тег
Видео
- 1 ответ
- 1 вопрос
0 Вклад в тег
Windows
- 1 ответ
- 0 вопросов
0 Вклад в тег
Алгоритмы
- 1 ответ
- 0 вопросов
0 Вклад в тег

Лучшие ответы пользователя

Все ответы (7)

Какими ключами задать ffmpeg повтор и ожидание при закачке ts из m3u8 (HLS)?

Алексей Рясский @Alex-rsk
Бэкендер

Попробуйте перед -i добавить
-timeout 10000000 -reconnect 1 -reconnect_at_eof 1 -reconnect_streamed 1 -reconnect_delay_max 2

Чтобы сохранялись промежуточные закачки, предлагаю сохранять выкачанное фрагментами по 2-10сек (зависит от длины сегмента стрима). Потом сделаете 1 конкат для файлов и получите большой фильм. Фильтр -f segment в помощь.

Ответ написан более двух лет назад

4 комментария

4 комментария
Алгоритмы определения смены голосов в диалогах. Есть ли они? И если есть, то в чём их суть?

Алексей Рясский @Alex-rsk
Бэкендер

Да, есть. То, что вам нужно, называется диаризация. Нейросеть Whisper умеет такое делать. Но это даже на GPU занимает время.
Суть, скорее всего в классификации спектров голосов. Те, сначала распознаются слова, потом участки со словами классифицируются по спектру нейросетью. Или численными методами, например, сверткой спектров, но тогда нужны образцы спектра говорящих.
Не копал, если честно, но лично я бы делал так.

Ответ написан более двух лет назад

1 комментарий

1 комментарий