Для парсинга есть функция, основанная на file_get_contents():
function load_file()
{ ....
// Throw an error if we can't properly load the dom.
if (($error=error_get_last())!==null) {
$this->clear();
return false;
}
}
Если какая-то из страниц не прогрузилась, выскакивает Warning. Информация падает в лог. Последующие страницы я не могу парсить,
потому что в логе навсегда сохранилась ошибка, в итоге функция всегда возвращает FALSE.
В
описании функции error_get_last() есть пример, как можно очистить, но я не могу применить в своем коде:
foreach ($item as $link) {
set_error_handler('var_dump', 0);
@$error_clear
restore_error_handler();
$html = new simple_html_dom();
$html -> load_file($link);
if (!empty($html->root)) { parsing }
Очень надеюсь на помощь!