Какие существуют open source библиотеки для проверки текстов на уникальность?

Доброго времени суток.

Имеется некоторое количество текстов. Периодически добавляются новые. Требуется проверить, какой процент совпадения в очередном добавляемом тексте. Тексты небольшие, одна две страницы A4.

Возможно, существуют какие-нибудь open source (и не только) библиотеки с реализацией того же алгоритма шинглов?

Спасибо.
  • Вопрос задан
  • 2647 просмотров
Пригласить эксперта
Ответы на вопрос 1
Deerenaros
@Deerenaros
Программист, математик, задрот и даже чуть инженер
А в чём проблема его реализовать? Да и с гуглом у всех в последнее время проблемы.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы