@Kripto77

Как почистить xml файл от недопустимых символов?

На сайт из другой программы приходит xml файл в который часто попадает строка

<UNITS>&#4; Not Applicable</UNITS>

PHP не может отпарсить файл - выдает ошибку

Warning: simplexml_load_string(): Entity: line 34365: parser error : xmlParseCharRef: invalid xmlChar value 4 in

Пытаюсь перед парсингом почистить:

$str =  file_get_contents($file_xml);
$str = str_replace('&#4;', '', $str);
$xml = simplexml_load_string($str);


Но эти символы остаются в строке
  • Вопрос задан
  • 1109 просмотров
Решения вопроса 1
webinar
@webinar Куратор тега PHP
Учим yii: https://youtu.be/-WRMlGHLgRg
Скорее всего проблема в том что, что кодировка файла отличается от Вашей, почитайте тут:
www.cyberforum.ru/php-beginners/thread707907.html
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
@Kripto77 Автор вопроса
Максим Вы оказались правы - подсовывали файл в кодировке UCS-2 вместо UTF-8.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы