Задать вопрос

Русская буква Х и utf-8?

Добрый вечер!
Занимаюсь парсингом новостей со старой версии сайта на новую. Старый сайт на UTF-8, новый так же будет на UTF-8.
Столкнулся с проблемой, что вместо русской буквы Х показывается непонятный символ. Соответственно, при записи в новую таблицу все, что было в названии после буквы Х обрезается.

При попытке сконвертировать строку из utf8 в windows-1251 и обратно на первом этапе получаю ошибку iconv(): Detected an illegal character in input string

Вот так получается при парсинге:
---------
Представители коммерчески� организаций оказали помощь.......
---------
парсер сделан на PHP и запускается из консоли
  • Вопрос задан
  • 402 просмотра
Подписаться 3 Оценить Комментировать
Пригласить эксперта
Ответы на вопрос 3
Замени все х на нормальные
Ответ написан
При первом парсинге поставьте модификатор u у регулярки типа так:
('/текст/ismu', $res)
Ответ написан
Комментировать
@krypt3r
1. Смысла что-то перекодировать не вижу, у вас же оба сайта на UTF-8.
2. Смысла в парсере также не вижу. Вам что, заказчик не дал доступ к БД или хотя бы дамп?
3. Разберитесь, что у вас там реально за символ (его код).
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы