import re
text = '''
Первое предложение.
Второе предложение!
Третье предложение?
Четвёртое предложение...
Пятое предложение.
Ещё одно предложение…
'''
split_regex = re.compile(r'[.|!|?|…]')
sentences = filter(lambda t: t, [t.strip() for t in split_regex.split(text)])
for s in sentences:
print(s)
Первое предложение
Второе предложение
Третье предложение
Четвёртое предложение
Пятое предложение
Ещё одно предложение
import re
prop = 'Ехал Грека. Через реку. Видит Грека - в реке рак... Сунул Грека руку в реку. Рак за руку. Греку. Цап'
re.split("\. |\.\.\. ", prop)
['Ехал Грека', 'Через реку', 'Видит Грека - в реке рак', 'Сунул Грека руку в реку', 'Рак за руку', 'Греку', 'Цап']
import re
with open("блаблабла.txt", "rb") as f:
s = re.sub(r'\s+', ' ', f.read().decode('WINDOWS-1251'), flags=re.M)
for s in re.split(r'(?<=[.!?…]) ', s):
print(s)