Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Sushkov
@Sushkov
">alert("yohoho")
Python
Как узнать структуру сайта?
Как узнать структуру сайта? Как это делают те же самые сканеры.
Вопрос задан
более трёх лет назад
854 просмотра
Комментировать
Подписаться
2
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
1
Duha666
@Duha666
Ходят по всем видимым ссылкам от главной, и можно еще чекать стандартные пути(например /static).
Ответ написан
более трёх лет назад
4
комментария
Нравится
1
4
комментария
Facebook
Вконтакте
Twitter
Sushkov
@Sushkov
Автор вопроса
Где они берут эти самые ссылки? Или путем парсинга страницы начиная с главной лезут по всему сайту повторяя алгоритм?
Написано
более трёх лет назад
Duha666
@Duha666
Sushkov
: Именно так. Парсят
Написано
более трёх лет назад
Sushkov
@Sushkov
Автор вопроса
Duha666
: регулярками или есть что-то для таких целей?
Написано
более трёх лет назад
Duha666
@Duha666
HTML-парсеры. Регулярки не для таких задач. Если вас интересует готовое решение на Python, то смотрите web-crawler'ы. Например Scrapy
Написано
более трёх лет назад
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
+1 ещё
Простой
Как сделать проверку при кике есть ли человек в беседе или нет?
1 подписчик
5 часов назад
41 просмотр
1
ответ
Python
+2 ещё
Простой
Как добавить в приложение видео из html-фреймов (youtube, vk, vimeo)?
2 подписчика
12 часов назад
215 просмотров
2
ответа
Python
+2 ещё
Простой
Как пользоваться методом messages.addChatUser vk api?
1 подписчик
вчера
62 просмотра
1
ответ
Python
Простой
Какие ошибки в понимании объектов?
1 подписчик
28 февр.
116 просмотров
1
ответ
Python
Простой
Создал код и когда пишу в powershell pyinstaller --onefile --windowed --icon=icon.ico testret.py пишет IndexError: tuple index out of range?
1 подписчик
28 февр.
67 просмотров
1
ответ
Python
+2 ещё
Простой
Как указать путь к chromedriver.exe в seleniumbase?
1 подписчик
28 февр.
46 просмотров
0
ответов
Python
Простой
Как определить правильно IP для замены функции PrintLastLog на свою?
1 подписчик
28 февр.
39 просмотров
1
ответ
Python
+2 ещё
Простой
Как выделить текст после парсинга?
1 подписчик
24 февр.
297 просмотров
1
ответ
Python
+2 ещё
Простой
Как вывести определенное расширение TLS из .pcapng файла с помощью pyshark?
1 подписчик
24 февр.
80 просмотров
1
ответ
Python
Средний
Как правильно написать код на Python для шифра «Цезарь»?
1 подписчик
24 февр.
1225 просмотров
2
ответа
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python-разработчик
Dalyoko
от 2 000 до 4 000 $
Python developer
Greenway Global
•
Новосибирск
от 150 000 ₽
Backend разработчик Middle (Python)
Bitbanker.ru
•
Москва
от 300 000 до 350 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама