Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
Sushkov
@Sushkov
">alert("yohoho")
Python
Как узнать структуру сайта?
Как узнать структуру сайта? Как это делают те же самые сканеры.
Вопрос задан
более трёх лет назад
860 просмотров
Комментировать
Подписаться
2
Оценить
Комментировать
Facebook
Вконтакте
Twitter
Решения вопроса
1
Duha666
@Duha666
Ходят по всем видимым ссылкам от главной, и можно еще чекать стандартные пути(например /static).
Ответ написан
более трёх лет назад
4
комментария
Нравится
1
4
комментария
Facebook
Вконтакте
Twitter
Sushkov
@Sushkov
Автор вопроса
Где они берут эти самые ссылки? Или путем парсинга страницы начиная с главной лезут по всему сайту повторяя алгоритм?
Написано
более трёх лет назад
Duha666
@Duha666
Sushkov
: Именно так. Парсят
Написано
более трёх лет назад
Sushkov
@Sushkov
Автор вопроса
Duha666
: регулярками или есть что-то для таких целей?
Написано
более трёх лет назад
Duha666
@Duha666
HTML-парсеры. Регулярки не для таких задач. Если вас интересует готовое решение на Python, то смотрите web-crawler'ы. Например Scrapy
Написано
более трёх лет назад
Пригласить эксперта
Ответы на вопрос
0
Ваш ответ на вопрос
Войдите, чтобы написать ответ
Войти через центр авторизации
Похожие вопросы
Python
Простой
Существуют ли сервисы: онлайн python editor для совместного использования?
1 подписчик
8 часов назад
47 просмотров
1
ответ
Python
Простой
На каком языке пишут описание функций в Python?
1 подписчик
вчера
242 просмотра
3
ответа
Python
+2 ещё
Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
1 подписчик
23 сент.
229 просмотров
1
ответ
Python
Простой
Как парсить pdf-ки с вк с помощью Python?
1 подписчик
16 сент.
322 просмотра
1
ответ
Python
+1 ещё
Простой
Почему возникает синтаксическая ошибка: invalid decimal literal?
1 подписчик
15 сент.
168 просмотров
2
ответа
Python
+1 ещё
Простой
Почему модель обнаружения объектов YOLO работает медленно?
1 подписчик
14 сент.
188 просмотров
1
ответ
Python
Простой
Что можно улучшить или оптимизировать в коде, чтобы он не был таким длинным?
2 подписчика
10 сент.
437 просмотров
4
ответа
Python
+3 ещё
Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
1 подписчик
09 сент.
168 просмотров
0
ответов
Python
Простой
Как получить из URL имя страницы?
1 подписчик
08 сент.
199 просмотров
2
ответа
Python
+1 ещё
Простой
Почему у Python проблемы с форматированием?
1 подписчик
08 сент.
228 просмотров
1
ответ
Показать ещё
Загружается…
Вакансии с Хабр Карьеры
Python developer
Digital Clouds
от 160 000 ₽
Python разработчик
Selecty
от 280 000 до 380 000 ₽
Python разработчик
ITK academy
•
Казань
от 75 000 ₽
Минуточку внимания
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама