Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Sushkov
@Sushkov
">alert("yohoho")
Python
Как узнать структуру сайта?
Как узнать структуру сайта? Как это делают те же самые сканеры.
Вопрос задан
более трёх лет назад
855 просмотров
Комментировать
Подписаться
2
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
1
Duha666
@Duha666
Ходят по всем видимым ссылкам от главной, и можно еще чекать стандартные пути(например /static).
Ответ написан
более трёх лет назад
4
комментария
Нравится
1
4
комментария
Facebook
Вконтакте
Twitter
Sushkov
@Sushkov
Автор вопроса
Где они берут эти самые ссылки? Или путем парсинга страницы начиная с главной лезут по всему сайту повторяя алгоритм?
Написано
более трёх лет назад
Duha666
@Duha666
Sushkov
: Именно так. Парсят
Написано
более трёх лет назад
Sushkov
@Sushkov
Автор вопроса
Duha666
: регулярками или есть что-то для таких целей?
Написано
более трёх лет назад
Duha666
@Duha666
HTML-парсеры. Регулярки не для таких задач. Если вас интересует готовое решение на Python, то смотрите web-crawler'ы. Например Scrapy
Написано
более трёх лет назад
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Как правильно обрабатывать ошибки при чтении файла?
1 подписчик
15 часов назад
87 просмотров
3
ответа
Python
+2 ещё
Простой
Как реализовать удаление файлов(директорий) с HDD в рамках работы с dag в airflow?
2 подписчика
18 часов назад
114 просмотров
1
ответ
HTML
+2 ещё
Простой
Как с помощью Selenium на Python найти элемент html страницы, который расположен в #shadow-root (open)?
1 подписчик
21 час назад
74 просмотра
2
ответа
Python
+1 ещё
Простой
Не сохраняет данные в переменную в telebot?
1 подписчик
22 часа назад
28 просмотров
1
ответ
Python
Простой
Как получить данные о ОЗУ в Python (точнее как их парсить)?
1 подписчик
вчера
171 просмотр
1
ответ
Python
+1 ещё
Простой
Возвращается непонятная ошибка, связанная с COM-портом (неточно) при использовании модуля WMI на python. Как решать?
1 подписчик
вчера
266 просмотров
2
ответа
Python
+1 ещё
Простой
Modify response на undetected chromedriver?
1 подписчик
01 апр.
85 просмотров
0
ответов
Python
+1 ещё
Простой
Куда отсылать вирус для антивирусов?
1 подписчик
01 апр.
390 просмотров
1
ответ
Python
+4 ещё
Средний
Как реализовать фарм-бота для игры Rush Royale?
1 подписчик
01 апр.
364 просмотра
1
ответ
Python
Простой
Как получить user_id в python из словаря в моем коде?
1 подписчик
01 апр.
94 просмотра
0
ответов
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Старший Python разработчик/Senior Python developer
Платежное решение
•
Москва
До 300 000 ₽
Python разработчик Middle+/Senior
Arcanis
•
Бали
от 3 000 до 4 000 $
Руководитель группы разработки Python/Tech Lead Python
Платежное решение
•
Москва
До 500 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама