есть php код который парсит 2 страницы:
$url1 = 'http://www.championat.com/football/_england/773/calendar/date.html';
$url2 = 'http://www.championat.com/football/_england/1042/calendar/tour.html';
//Вернет пустую страницу
echo HtmlDomParser::file_get_html($url1);
//Вернет уже страницу с контентом
echo HtmlDomParser::file_get_html($url2);
Так вот когда парсим $url2, то она парсится нормально, а вот ссылка из $url1 не парсится, то есть возвращается пустой рузальтат, а не нужная страница. Почему? Куда копать?
Thanks in advance
UPD:
Нашел в чем проблема. Я использовал simple_html_dom из этого пакета
https://packagist.org/packages/mgargano/simplehtmldom. В функции file_get_html в коде класса есть строки:
$contents = file_get_contents($url, $use_include_path, $context, $offset);
if (empty($contents) || strlen($contents) > MAX_FILE_SIZE)
{
return false;
}
То есть, если длина контента который мы парсим больше максимальной длины, то ничего не делаем. Вообщем меняем значение константы MAX_FILE_SIZE с 600000 на 6000000 и все работает. Надо еще учесть, что при update composer'а в проекте исходники будут затираться новой версией.