Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Руслан Левиев
Conflict Intelligence Team
20
вклад
63
вопроса
22
ответа
14%
решений
Ответы пользователя по тегу
Парсинг
Избавление от рекурсивного перехода при парсинге сайтов
Руслан Левиев
@ruskar
Conflict Intelligence Team
Как только по URL определить что эта страница уже парсилась — не знаю. Как по контенту определить: можно, например, запоминать в базе хэш от HTML-кода страницы и потом при парсинге новой страницы смотреть, есть ли уже такой хэш в базе.
Ответ написан
более трёх лет назад
2
комментария
Нравится
2
комментария
Оценили как «Нравится»
Закрыть
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама