DevMan:
У меня логика вот такая была:
Ищем время, у него всегда одинаковый формат. Если после времени идет только [A-Za-z _-,:], то пропустить это время и запись, если идет "текст в []" или "текст, а за ним текст в []", тогда считываем и сохраняем это все.
Либо я чего-то не понимаю, либо оно возьмет абсолютно все записи?
Если, что то я считываю это все с файла. Пример - pastebin.com/xF9mU6Zk
Нужны только записи в которых после времени есть какой-то текст в []
Что-то похоже на то, что мне нужно. Спасибо за ответ.
А что делать если у меня есть записи вот такого вида:
1й вид:
4
00:00:12,733 --> 00:00:15,533
[Airplane engine roars]
2й вид:
5
00:00:15,533 --> 00:00:17,767
She is [never] seen again.
3й вид:
7
00:00:27,033 --> 00:00:30,233
new leads send me across
the world in search of answers.
Здесь есть два вида, которые мне нужны. А именно в которых есть слово/фраза заключенная в [].
К этой фразе так же нужно время. Что по этому скажете?
Yura Khlyan: Вы не поняли. Считываю вот так:
with open ('subs.srt', 'r') as file:
data = file.read().replace('\n', '')
Есть записи вот такие:
"
70
00:03:12,800 --> 00:03:14,767
[Airplane engine roars]
"
А есть вот такие:
70
00:67:12,800 --> 00:68:14,767
Airplane
"
У меня логика вот такая была:
Ищем время, у него всегда одинаковый формат. Если после времени идет только [A-Za-z _-,:], то пропустить это время и запись, если идет "текст в []" или "текст, а за ним текст в []", тогда считываем и сохраняем это все.