Как средствами XPath опознать сломанный img блок в html?
Например, есть два img блока, в одном из которых ссылка внутри src присутствует, но ведет в никуда.
Вопрос таков, можно ли исключительно средствами XPath различить эти блоки по признаку сломанности?
Допустим в интернете есть страница с этими блоками шредингера, через Xpath нужно спарсить лишь тот что рабочий, но с точки зрения html оба блока выглядят нормально и ничего не предвещает что один из них сломан.
Ведёт в никуда это значит линк пустой или невалидный, то есть по обращению к полному урл он не выдаёт код 200 ? Тогда наверное можно, вручную извлекая содержимое src, делая из него абсолютный путь и делая запрос по нему.
Но сайт может быть настроен так что он не будет выдавать ошибку при открытии несуществующего на нем ресурса, а перенаправит например на заглавную страницу.