Почему при парсинге страницы возвращается пустая страница?

есть php код который парсит 2 страницы:
$url1 = 'http://www.championat.com/football/_england/773/calendar/date.html';
$url2 = 'http://www.championat.com/football/_england/1042/calendar/tour.html';

//Вернет пустую страницу
echo HtmlDomParser::file_get_html($url1);

//Вернет уже страницу с контентом
echo HtmlDomParser::file_get_html($url2);


Так вот когда парсим $url2, то она парсится нормально, а вот ссылка из $url1 не парсится, то есть возвращается пустой рузальтат, а не нужная страница. Почему? Куда копать?

Thanks in advance

UPD:
Нашел в чем проблема. Я использовал simple_html_dom из этого пакета https://packagist.org/packages/mgargano/simplehtmldom. В функции file_get_html в коде класса есть строки:
$contents = file_get_contents($url, $use_include_path, $context, $offset);
    if (empty($contents) || strlen($contents) > MAX_FILE_SIZE)
    {
        return false;
    }


То есть, если длина контента который мы парсим больше максимальной длины, то ничего не делаем. Вообщем меняем значение константы MAX_FILE_SIZE с 600000 на 6000000 и все работает. Надо еще учесть, что при update composer'а в проекте исходники будут затираться новой версией.
  • Вопрос задан
  • 3290 просмотров
Пригласить эксперта
Ответы на вопрос 2
Проверьте какие хеадеры приходят по первой ссылке.
Ответ написан
Комментировать
lexxpavlov
@lexxpavlov
Программист, преподаватель
попробуйте вместо
echo HtmlDomParser::file_get_html($url1);
написать
$dom = HtmlDomParser::file_get_html($url1);
var_dump($dom);

Так можно будет увидеть, что реально возвращает команда. Будет ли там объект класса simple_html_dom или нет.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы