Запускаю парсер для двох однотипных страниц
court.gov.ua/sud1820 и
court.gov.ua/sud0828. Цель - извлечь контакты суда. Разметка и кодировка страниц одна и та же. При обработке sud1820 получаю, то что желаю
41200
смт Ямпіль
бул. Ювілейний, буд. 8/2
А при обработке страницы sud0828 парсер не видит innertext.
require_once __DIR__ . '/parser/simple_html_dom.php';
$data = file_get_contents('http://court.gov.ua/sud0828');
$data = mb_convert_encoding($data, 'utf-8', 'windows-1251');
$data = str_get_html_2($data);
if ($data->innertext != '') {
$table = $data->find('table.menur1');
if($table){
for($i=0;$i<count($table);$i++){
CourtFullAddress = strip_tags($table[$i]->find('tr', 1)->children(1));
list($CourtPostCode, $CourtCity, $street, $build, $section, $section2, $section3) = explode(",", $CourtFullAddress);
$CourtStreet = $street.', буд. '.$build.', '.$section.', '.$section2.', '.$section3;
print $CourtPostCode.'<br/>';
print $CourtCity.'<br/>';
print $CourtStreet.'<br/><br/>';
}
}
Пробовал через curl_init, результат тот же.
В чем может быть проблема?