Откуда text.ru берет данные для проверки на плагиат?

Привет. У кого есть какие предположения откуда text.ru берет данные для проверки на плагиат? У них есть какой-то более быстрый источник данных чем поисковая выдача.
Например, я на одном из сайтов добавил уникальный текстовый контент, и буквально через минуту он (контент) уже был обнаружен и проанализирован алгоритмом text.ru. А появления этого контента в поисковой выдаче яндекса и гугла еще надо ждать не одну неделю.
  • Вопрос задан
  • 1839 просмотров
Пригласить эксперта
Ответы на вопрос 2
Exomode
@Exomode
Архитектор ПО
Скорее всего, там классический "накопительный" подход бигдаты. Асинхронно в бэкграунде идёт парсинг данных из сети, это позволяет всегда держать данные актуальными и динамически её пополнять. Затем формируются метаданные для быстрого анализа, они уже и хранятся в базе сервиса. Затем, когда Вы уже непосредственно ввели текст и отправили на валидацию, идёт анализ сопоставлений с помощью нечёткого поиска или других оптимизированных алгоритмов работы с текстом, сопоставляются метаданные и выдаётся результат. Конечно, я могу и ошибаться, но если бы мне нужно было реализовать подобное решение, то принцип работы у него был бы схож с вышеописанным.
Ответ написан
Комментировать
dimonchik2013
@dimonchik2013
non progredi est regredi
ха-ха, все неизведанное нам кажется чудесным

секрета никакого нет: поисковики

появления этого контента в поисковой выдаче яндекса и гугла еще надо ждать не одну неделю.
, а в duckduckgo можно и не ждать

разумеется, text.ru держит нос по ветру и пасет остальные биржи ( быстро выложил, быстро проиграл (с)), но чуСед никаких нет, есть просто что-то вам непривычное

это очевидно при проверке текста, например, с разных ИП
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы