Задать вопрос

Морс Суперберг @NooooN

Секьюрник, гык. Лавки вебчик за 300.

веб-разработка

Как работает умный web-crawler?

Народ, привет! Появилась задача написать на php || python серверный web-crawler который будет бродить по интернету, собирать ссылки, просто все ссылки, что найдет.

Вот стало интересно, как это реализуется, если мы будем тупо скачивать страницы и регулярками вытаскивать ссылки, будет так себе, откровенно говоря, так как сайт может грузить все ссылки через ajax (body страницы). Или есть сайты с бесконечными циклами, которые убивают подобно ПО (при переходе на сайт автоматически генерируется рабочая ссылка, которая ведет на сайт с такой же динамически сгенерированной ссылкой, и так до бесконечности). Может посоветуете готовое решение, или объясните, как лучше это все делать? пасиб))))

Вопрос задан более трёх лет назад
276 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

Fixid @Fixid

Selenium, а дальше пишите свою логику

Ответ написан более трёх лет назад

Комментировать

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Веб-разработка

Простой
Как определить от какого агрегатора пришел webhook?
- 1 подписчик
- 20 сент.
- 141 просмотр
1

ответ
JavaScript

+2 ещё

Простой
Можно ли заменить кликанье мышью по веб-интерфейсу cli-командой?
- 3 подписчика
- 13 сент.
- 949 просмотров
2

ответа
HTML

+4 ещё

Средний
Кривое отображение сайта на iOS-устройствах?
- 2 подписчика
- 13 сент.
- 374 просмотра
1

ответ
Веб-разработка

+1 ещё

Простой
Предупреждение сафари на сайте. Как его убрать?
- 1 подписчик
- 09 сент.
- 183 просмотра
0

ответов
Веб-разработка

Средний
Как в веб панели 3x-ui добавить favicon?
- 1 подписчик
- 04 сент.
- 132 просмотра
2

ответа
Веб-разработка

+1 ещё

Простой
Как защитить сайт от ботов с отказами?
- 2 подписчика
- 03 сент.
- 422 просмотра
3

ответа
Веб-разработка

Простой
Где правильно делать фильтрацию?
- 2 подписчика
- 03 сент.
- 490 просмотров
0

ответов
Веб-разработка

Простой
Где разместить одностраничник реакта?
- 4 подписчика
- 02 сент.
- 439 просмотров
2

ответа
Веб-разработка

Средний
Какой конструктор сайтов с динамической таблицей можете порекомендовать?
- 1 подписчик
- 28 авг.
- 187 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг.
- 388 просмотров
3

ответа
Показать ещё Загружается…

Web-разработчик 1С-Битрикс

Веб-Центр

До 150 000 ₽

React разработчик

ITK academy • Нижний Новгород

от 80 000 до 120 000 ₽

Senior-разработчик React

СмартПро • Москва

от 100 000 ₽