И все же пользоваться re без import re не получится. Поэтому встроенность вопрос спорный.
предложение может заканчиваться разными знаками.
точка в предложении может использоваться в разделении десятичных знаков и инициалах.
если такое и можно наколхозить сплитами то это точно не бестпрактис будет.
не согласен
подразумеваются regexp-ы типа '.+?[.!?]'
split задача была бы не про предложения, а про слова в тексте
В моем тексте нет ни капли агрессии, просто мне интересна почва твоего негодования в адрес использования сплит/реплейсов, пока что я вижу только порцию за порцией несуразной чепухи, так что не тебе говорить о бредесначала ты назвал мои слова бредом, теперь чепухой. заметь, не я твои слова назвал бредом, а ты мои, и теперь ты заявляешь: "так что не тебе говорить о бреде". Но о нем говорил только ты. Правда теперь еще добавил чепуху. Чепуха звучит уже мягче, менее агрессивно. Молодец, исправляешься.
This book is a treatise on the theory of ethics, very popular during the Renaissance. The first line of Lorem Ipsum, "Lorem ipsum dolor sit amet..", comes from a line in section 1.10.32.
The standard chunk of Lorem Ipsum used since the 1500s is reproduced below for those interested. Sections 1.10.32 and 1.10.33 from "de Finibus Bonorum et Malorum" by Cicero are also reproduced in their exact original form, accompanied by English versions from the 1914 translation by H. Rackham.
In [18]: text = """This book is a treatise on the theory of ethics, very popular during the Renaissance. The first line of Lorem Ipsum, "Lorem ipsum dolor sit amet..",
...: comes from a line in section 1.10.32.
...:
...: The standard chunk of Lorem Ipsum used since the 1500s is reproduced below for those interested. Sections 1.10.32 and 1.10.33 from "de Finibus Bonorum et Malo
...: rum" by Cicero are also reproduced in their exact original form, accompanied by English versions from the 1914 translation by H. Rackham.
...: """
In [19]: import re
In [20]: pattern = r"(.*?)(?<=[.?!])\s+((?=[A-Z]\w+\s)|$)"
In [21]: for sentence in re.findall(pattern, text):
...: print (sentence[0])
...:
This book is a treatise on the theory of ethics, very popular during the Renaissance.
The first line of Lorem Ipsum, "Lorem ipsum dolor sit amet..", comes from a line in section 1.10.32.
The standard chunk of Lorem Ipsum used since the 1500s is reproduced below for those interested.
Sections 1.10.32 and 1.10.33 from "de Finibus Bonorum et Malorum" by Cicero are also reproduced in their exact original form, accompanied by English versions from the 1914 translation by H. Rackham.
чтоб матчить предложения встроенных функций недостаточно
придется использовать модуль re
ты начал нести бред про "встроенных функций не хватит" говоря об регексах и "сплит/реплейс халтура"
Изучите циклы и встроенные функции - вам их хватит с головой
Да я не согласен с тобой. И сдругими пунктами не согласен. Что тут такого? У меня отличная от твоей парадигма.
т.е. в итоге ты признаешь что регекспы для этой задачи подходят лучше.
Нужно написать программу которая будет в текстовом файле искать конец предложений
не можешь ни слова сказать почему сплит/реплейс - это халтурая все написал выше. И там целых 63 слова. Еще раз поцитирую:
Я же просто назвал халтурой вариант с сплитами. Не твой конкретный вариант, я ж его не видел. Я можно сказать свой, гипотетический, вариант так называю. Ну т.е. мозг так работает. Мысленный эксперимент если хочешь. Я просто представил два гипотетических сценария как будто эту задачу нужно решить мне самому. Один вариант с регекспами, а другой с сплитами. Потом мысленно провел код-ревью и выбрал лучшийТак кто из нас не умеет в буквы?
либеральными правилами поведениямиО нет
но в итоге ты согласен с моим решением. Какой то когнитивный диссонанс, не находишь?
сплит/реплейс это халтура