@pcdesign

Как искать цитаты в тексте с помощью python?

Мне надо проверить валидность цитат, что цитата на самом деле принадлежит перу данного автора.
Вот для примера цитата:
Несмотря на то, что доктора лечили его, пускали кровь и давали пить лекарства, он все-таки выздоровел.

Лев Толстой ВОЙНА И МИР
Или вот вариант по-сложнее:
...в военном деле ничего не значат самые глубокомысленно обдуманные планы (как он видел это в Аустерлицком походе) <...> все зависит от того, как отвечают на неожиданные и не могущие быть предвиденными действия неприятеля, что все зависит от того, как и кем ведется все дело...

Это тоже Лев Толстой ВОЙНА И МИР.
Тут есть сокращения, которые допустимы при цитировании, но как быть, когда нужно найти это в тексте?

Как лучше сделать такую проверку?

P.S: Все тома Войны и Мира:
modernlib.net/series/voyna_i_mir
Правила оформления и сокращений цитат:
new.gramota.ru/spravka/letters/54-rubric-76
  • Вопрос задан
  • 428 просмотров
Решения вопроса 1
Текст довольно велик и первое пришедшее в голову - построение и поиск регулярным выражением по указанным правилам - будет малоэффективен.
Если таких текстов будет множество, а не только "Война и Мир", то стоит задуматься о применении полнотекстовой поисковой системы, напр. Elasticsearch.
Если это учебный проект, можно попробовать обойтись 1-ым способом.
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
shpaker
@shpaker
Вольный хлебопашец
Искать отдельно вхождения всех частей между точками в нужном порядке?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы