kirill_782
@kirill_782
Днем я Маринетт

Как правильно спарсить HTML?

pastebin.ru/v45Vc0eg - HTML код.
Нужно в переменную загрузить содержимое каждого тега td
$dom = new DOMDocument;
$dom->loadHTML($HTML); //Тут куча ошибок.
$tr= $dom->getElementsByTagName('tr');

Warning: DOMDocument::loadHTML(): Unexpected end tag : td in Entity, line: 1 in
C:\Users\LOL\Desktop\vkup\test (5).php on line 14
PHP Warning:  DOMDocument::loadHTML(): Unexpected end tag : tr in Entity, line:
1 in C:\Users\LOL\Desktop\vkup\test (5).php on line 14

Надо в массив записать все значения тегов tr. Или лучше использовать preg_match?
  • Вопрос задан
  • 590 просмотров
Решения вопроса 1
orlov0562
@orlov0562 Куратор тега PHP
I'm cool!
У тебя не валидный Html, а DOMDocument не настолько умный чтобы его нормализовать... Попробуй прогнать предварительно через Tidy ( php.net/manual/ru/intro.tidy.php ). Ну, и для парсинга лучше чего-нибудь адаптированние использовать: DiDOM ( https://github.com/Imangazaliev/DiDOM ) или PHP Simple HTML DOM ( simplehtmldom.sourceforge.net ) будет гораздо легче поддерживать, чем регулярки ...
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@springimport
Не думали напрямую копировать с funroyale.com ?

p.s. вы же договорились об этом с владельцами?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы