Задать вопрос

Как в php бороться с символами из расширенной utf-8 кодировки?

Пользователь пишет сообщение, которое содержит розочку (тут не поддерживается).
Далее после некоторых манипуляций в php приходит сериализованая строка, которая в том числе содержит полный текст сообщения.
Эта строка парсится unserialize().
Если в текст попадают, символы из расширения utf-8, то unserialize() возвращает false.
С другими символами-иконками проблем нет, например: ☕ .
Подскажите, как лучше бороться с символами из расширения?

Важное условие: Проект мультиязычный хайлоад, поэтому решение должно работать даже на японском языке.

P.S. Когда первый раз писал это сообщение, попытался вставить розочку сюда, но после нее все обрезалось :
  • Вопрос задан
  • 524 просмотра
Подписаться 3 Оценить Комментировать
Решения вопроса 1
KorroLion
@KorroLion Автор вопроса
В итоге решил очень просто: удалить из строки все символы, которые по номеру кода не попадают в стандартную таблицу.
/[^\x{0000}-\x{FFFF}]/u
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы