Какую библиотеку выбрать для веб-скраппинга?

Question

evilmolen @evilmolen

Какую библиотеку выбрать для веб-скраппинга?

Скажите, какую либу выбрать для простой работы с веб-сайтами и дальнейшим их парсингом.
Сам парсинг в данный момент осуществляется через XPath или Simple dom parser, важно лишь получение данных, авторизации и прочая эмуляция "реального" человека.
Нужный функционал: настройки заголовков, настройки куки (сохранение, ручная установка), отправка POST запросов (например, для авторизации) и т.п.. В общем, важна гибкость настроек. Раньше работал с неким "Ultimate Web Scraper Toolkit" но его функционал перестал устраивать, хочется чего-то более совершенного.
В данный момент остановился на "Guzzle", пока всем устраивает, хотя скорость работы не самая высокая. Тот же phantomjs работал быстрее, но он не подходит.
Можете посоветовать что-то на основе собственного опыта?

Вопрос задан более трёх лет назад
477 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack веб-разработчик на JavaScript и PHP

20 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как оптимально подтягивать og:img для списка статей с разных сайтов?
- 1 подписчик
- час назад
- 14 просмотров
0

ответов
PHP

+2 ещё

Простой
Как реализовать зеркало сайт Тильда?
- 1 подписчик
- 22 окт.
- 226 просмотров
0

ответов
PHP

+1 ещё

Простой
Почему перестала работать ЮКасса?
- 1 подписчик
- 19 окт.
- 295 просмотров
1

ответ
PHP

Простой
Как вычислить результат математических операций в строке?
- 1 подписчик
- 17 окт.
- 269 просмотров
3

ответа
PHP

Простой
Можно ли в PHP вкладывать однострочные комментарии // в многострочные /* */?
- 1 подписчик
- 16 окт.
- 255 просмотров
4

ответа
PHP

+1 ещё

Простой
Перестал работать php запрос к телеграмм?
- 1 подписчик
- 15 окт.
- 251 просмотр
1

ответ
PHP

+2 ещё

Простой
Как проще отправить изображение на стену канала?
- 1 подписчик
- 15 окт.
- 166 просмотров
1

ответ
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 140 просмотров
0

ответов
PHP

Простой
Как точно работает скрипт на RoadRunner?
- 1 подписчик
- 13 окт.
- 228 просмотров
1

ответ
PHP

+1 ещё

Простой
Стоит ли использовать файловый сервер в проекте?
- 2 подписчика
- 13 окт.
- 270 просмотров
3

ответа
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 180 000 до 250 000 ₽

PHP-разработчик (Symfony)

Мегаплан

от 160 000 ₽

Разработчик PHP/Go

ЭТП ГПБ / VESNA

До 220 000 ₽

Answer 1 · 2019-04-25 08:52:47

Отвечу на свой же старый вопрос
За эти годы перебрал некоторое количество библиотек, ничего лучше Symfony DomCrawler Component не нашел для себя.
Для меня это топ-1 по скорости работы, потреблению памяти и возможностям расширения.

Answer 2 · 2016-06-13 09:47:47

Muhammad @muhammad_97

PHP-разработчик

https://github.com/imangazaliev/didom

Ответ написан более трёх лет назад

Комментировать

Какую библиотеку выбрать для веб-скраппинга?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт