В чем различие между utf8mb4, UCS-4BE', 'UTF-32' PHP/MySQL?

Question

Иван Кряжев @t9221823420

PHP developer

В чем различие между utf8mb4, UCS-4BE', 'UTF-32' PHP/MySQL?

Необходимо определить числовой номер UTF-символа.

unpack('N', mb_convert_encoding($utf8Character, 'UCS-4BE', 'UTF-8'))[1]; - это все работает.
также некоторые предлагают конвертить в 'UTF-32BE' - зачем?

в MySQL данные хранятся в utf8mb4. это 4 байта на символ.

Хочу понять, зачем необходимо конвертировать в UCS-4BE, если у нас итак данные храняться в 4 байтах гарантированно.
Если не конвретировать, конструкция не работает - почему?

И не совсем понял чем всетаки отличаются UCS-4BE и UTF-32?

Вопрос задан более трёх лет назад
565 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Решения вопроса 1

2 комментария

Иван Кряжев @t9221823420 Автор вопроса

спсб. я это все прочитал, но не совсем понял, честно говоря. Тогда задам уточняющий вопрос. Для чего рекомендуют в MySQL переводить формат с UTF на UTF8mb4?

Предполагаю, что таким образом MySQL резервирует 4 байта? Тогда почему не в UTF32 хранить изначально, если расход памяти одинаковый!?

Написано более трёх лет назад
Rsa97 @Rsa97

t9221823420, В MySQL utf8 поддерживает символы от 1 до 3 байт, что соответствует диапазону от 0 до FFFF в UCS-4. Чтобы сохранять символы от 10000 до 1FFFFF (например, эмодзи) надо добавить четвёртый байт, для чего и нужна кодировка utf8mb4.
Но длина символа в utf8 переменная, то есть в лучшем случае (ASCII-127) одному символу соответствует один байт. Русские буквы кодируются двумя байтами, эмодзи - четырьмя. MySQL не резервирует место под строки, оно выделяется динамически по фактической длине строки в байтах (не в символах).

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
Как сделать это?
- 1 подписчик
- вчера
- 164 просмотра
2

ответа
MySQL

Простой
Влияет ли размер индекса на скорость MySQL?
- 3 подписчика
- 09 дек.
- 251 просмотр
2

ответа
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 210 просмотров
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- 05 дек.
- 182 просмотра
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- 04 дек.
- 166 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 144 просмотра
2

ответа
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 300 просмотров
3

ответа
PHP

Простой
Ошибка в php, как исправить?
- 1 подписчик
- 29 нояб.
- 282 просмотра
2

ответа
MySQL

+1 ещё

Простой
Как правильно реализовать структуру таблиц продукт и цены продуктов?
- 1 подписчик
- 20 нояб.
- 195 просмотров
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 433 просмотра
4

ответа
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Разработчик PHP (junior / стажер) - Laravel

CRM для НКО Мост данных

от 30 000 до 110 000 ₽

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

Answer 1 · 2017-11-01 09:31:33

в MySQL данные хранять̷̸ся в utf8mb4. это 4 байта на символ

Не четыре, а от одного до четырёх.

чем все-таки отличаются UCS-4BE и UTF-32?

UTF-32 - это подмножество UCS-4. UCS-4 поддерживает символы с кодами от 0 до 7FFFFFFF, UTF-32 - с кодами от 0 до 10FFFF. Суффиксы LE и BE - определяют порядок записи байтов, Little-Endian и Big-Endian.

Answer 2 · 2017-11-01 09:05:19

В кодировке utf8mb4 длина символа варьируется от 1 до 4 байт. В кодировках UCS-4 и UTF-32 длина символа всегда 4 байта. Чем они отличаются можно прочитать в википедии https://en.wikipedia.org/wiki/UTF-32

В чем различие между utf8mb4, UCS-4BE', 'UTF-32' PHP/MySQL?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт