Sc0undRel
@Sc0undRel

Как сравнить 2 текста и найти уникальные слова?

Есть ли инструмент, который сможет сравнить 2 текста и выписать уникальные слова, т.е. которые повторяются всего 1 раз?

желательно преобразовать все слова в начальную форму, но не обязательно

например
текст1: маша ела кашу
текст2: маша ела суп

инструмент должен сравнить 2 текста и выписать слова:
каша
суп
  • Вопрос задан
  • 431 просмотр
Пригласить эксперта
Ответы на вопрос 3
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
1. Нужно разбить 2 текста на отдельные слова и отсортировать.
2. Искать похожие в одном и в другом тексте и если есть такое - сразу исключать из двух массивов слов этих текстов.
3. Оставшиеся в массивах - будут уникальными ("не пересекающимися") для заданных двух текстов.

Похожие слова (строки) - можно отыскать с помощью PHP-скрипта нечёткого поиска или попробовать заказать у них сразу нужный софт для этой задачи.
Ответ написан
Комментировать
sim3x
@sim3x
In [1]: t1 = "маша ела кашу"

In [2]: t2 = "маша ела суп"

In [3]: set(t1.lower().split()) ^ set(t2.lower().split())
Out[3]: {'кашу', 'суп'}

+
https://pypi.python.org/pypi/normalizr/0.1.8
Ответ написан
@RuWeb
Вот сервис https://textcompare.ru/
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы