Добрый вечер!
Занимаюсь парсингом новостей со старой версии сайта на новую. Старый сайт на UTF-8, новый так же будет на UTF-8.
Столкнулся с проблемой, что вместо русской буквы Х показывается непонятный символ. Соответственно, при записи в новую таблицу все, что было в названии после буквы Х обрезается.
При попытке сконвертировать строку из utf8 в windows-1251 и обратно на первом этапе получаю ошибку iconv(): Detected an illegal character in input string
Вот так получается при парсинге:
---------
Представители коммерчески� организаций оказали помощь.......
---------
парсер сделан на PHP и запускается из консоли
1. Смысла что-то перекодировать не вижу, у вас же оба сайта на UTF-8.
2. Смысла в парсере также не вижу. Вам что, заказчик не дал доступ к БД или хотя бы дамп?
3. Разберитесь, что у вас там реально за символ (его код).