Все сервисы Хабра
Сообщество IT-специалистов
Ответы на любые вопросы об IT
Профессиональное развитие в IT
Закрыть
Задать вопрос
fidgethard
3
вклад
1
вопрос
5
ответов
0%
решений
Лайки
Информация
Ответы
Вопросы
Комментарии
Подписки
Нравится
Достижения
Парсим/грабим веб-страницы без мусора?
Алексей Черемисин
@leahch
3D специалист. Dолго, Dорого, Dерьмово.
Конечно есть -
lxml.de/lxmlhtml.html#cleaning-up-html
Ну и уже из очищенного можно выделять что нужно.
Да, забирать лучше библиотекой requests -
docs.python-requests.org/en/master
Ответ написан
более трёх лет назад
Комментировать
Нравится
7
Комментировать
Как изучаем Python?
alk
@Alexey_Kutepov
Разработчик программного обеспечения
Впервые слышу про "Пихон" =D Поправьте заголовок с Pyhon на Python)
Ответ написан
более трёх лет назад
Комментировать
Нравится
6
Комментировать
Оценили как «Нравится»
Закрыть
← Предыдущие
1
2
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
Войти через центр авторизации
Закрыть
Реклама