@Ioldyz

PHP парсинг rss на иврите через simplexml или domdocument ничего не выдает, почему?

Добрый день.
Пытаюсь получить данные RSS в виде массива или объекта
Сама ссылка на RSS - rss.mivzakim.net/rss/category/10
когда пробую через simplexml выдает ошибку

simplexml_load_string(): Entity: line 207: parser error : Entity 'ndash' not defined


если через DomDocument
$doc = new \DOMDocument();
  $doc->load($xmlstr);
  $root = $doc->documentElement;

то внутри $root только единица.....

Прошу помощи в данной задачи

P.S. в .htaccess стоит utf-8
  • Вопрос задан
  • 395 просмотров
Решения вопроса 1
muhammad_97
@muhammad_97
PHP-разработчик
https://github.com/imangazaliev/didom - с возможностью обработки невалидных документов
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
DmitriyEntelis
@DmitriyEntelis
Думаю за деньги
Иврит тут не причем, пробелема в обработке ndash. Вариантов решения проблемы 2:
1) Можно тупо заменить – в документе на обычное тире —
2) Можно воспользоваться любым парсером на чистом php, например https://github.com/revnode/xml
Не поленился проверить, Ваш файл он отлично обрабатывает.
Ответ написан
@assets
Back-end developer
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы