Задать вопрос
@AlekseenkoAV

Libxml2 как решить проблему с кириллическим символами?

Изучаю работу с библиотекой libxml2, использую ее для парсинга html страниц. Все в принципе понятно, но возникла проблема с кодировкой. Результат выдается в кодировке ISO-8859-1, ине удается получить читаемые кириллические символы. На вход функции htmlParseFile подаю файл в кодировке utf-8. Пытался использовать isolat1ToUTF8 но результат неудачный. Подскажите в какую сторону копать?
  • Вопрос задан
  • 246 просмотров
Подписаться 1 Оценить Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
  • Академия Эдюсон
    Frontend-разработчик: тариф PRO
    10 месяцев
    Далее
  • ProductStar × РБК
    Профессия: Инженер по тестированию + ИИ
    6 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
@raincons
Попробуйте вот это решение, https://github.com/glenscott/dom-document-charset/... - явно указать кодировку в документе.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы