Какие существуют open source библиотеки для проверки текстов на уникальность?
Доброго времени суток.
Имеется некоторое количество текстов. Периодически добавляются новые. Требуется проверить, какой процент совпадения в очередном добавляемом тексте. Тексты небольшие, одна две страницы A4.
Возможно, существуют какие-нибудь open source (и не только) библиотеки с реализацией того же алгоритма шинглов?