Задать вопрос
jacksparrow
@jacksparrow

Почему хабр при парсинге ведет себя некоректно?

Используя библиотеку пытаюсь распарсить страницу с хабра, но оно иногда не дает результата, file_get_content даёт аналогичный результат
$url='http://habrahabr.ru/post/251871/';
$html = SimpleHTMLDom::file_get_html($url);
echo $html;die;

Результат бывает как нормальный хтмл код, так и https://monosnap.com/image/1kQHsjYpsBgLnFD0YlkYW60...
Причем для одной страницы он сначало может быть негативный несколько раз, затем через 5 минут, он её нормально загружает.
П.С. Я знаю о наличии хабр апи, но доступ к нему закрытый. Аналогичные вопросы не затрагивают именно эту проблему или не дают ответа. Заранее спасибо
  • Вопрос задан
  • 2346 просмотров
Подписаться 1 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 1
ponich
@ponich
php,mysql,js
Попробуйте нормально зайти как нормальный пользователь на Habr. С UserAgent и Cookie. Для этого используйте CURL, ну или посылайте нужные заголовки через file_get_content и уже спарсенный HTML код кормите Вашей библиотеке
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы