Русская буква Х и utf-8?

Добрый вечер!
Занимаюсь парсингом новостей со старой версии сайта на новую. Старый сайт на UTF-8, новый так же будет на UTF-8.
Столкнулся с проблемой, что вместо русской буквы Х показывается непонятный символ. Соответственно, при записи в новую таблицу все, что было в названии после буквы Х обрезается.

При попытке сконвертировать строку из utf8 в windows-1251 и обратно на первом этапе получаю ошибку iconv(): Detected an illegal character in input string

Вот так получается при парсинге:
---------
Представители коммерчески� организаций оказали помощь.......
---------
парсер сделан на PHP и запускается из консоли
  • Вопрос задан
  • 391 просмотр
Пригласить эксперта
Ответы на вопрос 3
Замени все х на нормальные
Ответ написан
При первом парсинге поставьте модификатор u у регулярки типа так:
('/текст/ismu', $res)
Ответ написан
Комментировать
@krypt3r
1. Смысла что-то перекодировать не вижу, у вас же оба сайта на UTF-8.
2. Смысла в парсере также не вижу. Вам что, заказчик не дал доступ к БД или хотя бы дамп?
3. Разберитесь, что у вас там реально за символ (его код).
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
YCLIENTS Москва
от 200 000 до 350 000 ₽
Ведисофт Екатеринбург
от 25 000 ₽
Бюро Цифровых Технологий Санкт-Петербург
от 120 000 до 180 000 ₽
03 мая 2024, в 22:18
1000 руб./за проект
03 мая 2024, в 21:57
1000 руб./за проект
03 мая 2024, в 21:47
500 руб./за проект