jacksparrow
@jacksparrow

Почему хабр при парсинге ведет себя некоректно?

Используя библиотеку пытаюсь распарсить страницу с хабра, но оно иногда не дает результата, file_get_content даёт аналогичный результат
$url='http://habrahabr.ru/post/251871/';
$html = SimpleHTMLDom::file_get_html($url);
echo $html;die;

Результат бывает как нормальный хтмл код, так и https://monosnap.com/image/1kQHsjYpsBgLnFD0YlkYW60...
Причем для одной страницы он сначало может быть негативный несколько раз, затем через 5 минут, он её нормально загружает.
П.С. Я знаю о наличии хабр апи, но доступ к нему закрытый. Аналогичные вопросы не затрагивают именно эту проблему или не дают ответа. Заранее спасибо
  • Вопрос задан
  • 2346 просмотров
Пригласить эксперта
Ответы на вопрос 1
ponich
@ponich
php,mysql,js
Попробуйте нормально зайти как нормальный пользователь на Habr. С UserAgent и Cookie. Для этого используйте CURL, ну или посылайте нужные заголовки через file_get_content и уже спарсенный HTML код кормите Вашей библиотеке
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
11 мая 2024, в 00:19
1000 руб./за проект
10 мая 2024, в 23:51
30000 руб./за проект
10 мая 2024, в 23:33
2500 руб./за проект