Задать вопрос
kirill_782
@kirill_782
Днем я Маринетт

Как правильно спарсить HTML?

pastebin.ru/v45Vc0eg - HTML код.
Нужно в переменную загрузить содержимое каждого тега td
$dom = new DOMDocument;
$dom->loadHTML($HTML); //Тут куча ошибок.
$tr= $dom->getElementsByTagName('tr');

Warning: DOMDocument::loadHTML(): Unexpected end tag : td in Entity, line: 1 in
C:\Users\LOL\Desktop\vkup\test (5).php on line 14
PHP Warning:  DOMDocument::loadHTML(): Unexpected end tag : tr in Entity, line:
1 in C:\Users\LOL\Desktop\vkup\test (5).php on line 14

Надо в массив записать все значения тегов tr. Или лучше использовать preg_match?
  • Вопрос задан
  • 604 просмотра
Подписаться 2 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Skillfactory
    Профессия Fullstack веб-разработчик на JavaScript и PHP
    20 месяцев
    Далее
  • Хекслет
    PHP-разработчик
    10 месяцев
    Далее
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
Решения вопроса 1
orlov0562
@orlov0562 Куратор тега PHP
I'm cool!
У тебя не валидный Html, а DOMDocument не настолько умный чтобы его нормализовать... Попробуй прогнать предварительно через Tidy ( php.net/manual/ru/intro.tidy.php ). Ну, и для парсинга лучше чего-нибудь адаптированние использовать: DiDOM ( https://github.com/Imangazaliev/DiDOM ) или PHP Simple HTML DOM ( simplehtmldom.sourceforge.net ) будет гораздо легче поддерживать, чем регулярки ...
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@springimport
Не думали напрямую копировать с funroyale.com ?

p.s. вы же договорились об этом с владельцами?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы