Нужно написать программу, которая будет проверять текст на оригинальность. Например дипломные или курсовые работы.
С ссылкой
шинглы ознакомился.
Программа будет искать совпадения фрагментов текста на просторах интернета, в каких-нибудь статьях и т.п. Такие условия, нужно чтобы это было как-то связано с сетями-протоколами (это проект по компъютерным сетям в универ).
Посоветуйте литературу на эту тему. Желательно на русском.
Может какие-то Open Source проекты с открытым кодом есть, готовые алгоритмы или еще какая-нибудь полезная информация?