Php работа с регистром русских символов в UTF-8?

Question

skvot @skvot

PHP
Unicode

Php работа с регистром русских символов в UTF-8?

Приветствую, хабр!

Столкнулся с проблемой корректной работы функций изменений регистра символов при работе с русским текстом в кодировке UTF-8.

Вот функция, к которой я пришел. Она работает, но, имхо, выглядит крайне некрасиво:

function reverseStringCharactersCase($string)
{
    $reversedString = '';
    $string = iconv('UTF-8', 'cp1251', $string);
    
    for ($i = 0; $i < strlen($string); $i++) {
        if (isUpperCase($string[$i])) {
            $reversedString .= mb_strtolower($string[$i], 'cp1251');
        } else {
            $reversedString .= mb_strtoupper($string[$i], 'cp1251');
        }
    }

    return iconv('cp1251', 'UTF-8', $reversedString);
}

Что я пытался сделать, но не сработало:

1. Я попробовал использовать обычные функции обработки строк, а не из мультибайт библиотеки. Эти функции на русские строки вообще не реагировали, различные варианты использования setlocale() ни к чему не привели (ubuntu server 10.10).

2. Я пытался использовать mb_strtoupper с вторым аргументом 'utf-8', но и этот вариант не помог.

Я хочу добиться красивого кода, без использования multibyte функций и явного преобразования кодировки средствами iconv(). Прогу прощения, если вопрос нубский, надеюсь на помощь аудитории данного замечательного ИТ-ресурса.

Заранее спасибо!

Вопрос задан более трёх лет назад
10150 просмотров

1 комментарий

Подписаться 4 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее

Решения вопроса 1

6 комментариев

skvot @skvot Автор вопроса
aego@Aego-server:~$ locale -a C en_US.utf8 POSIX ru_RU.utf8

Я вот выше написал, оказывается, не работает почему-то только в for…
Написано более трёх лет назад
edogs @edogs

а) В for Вы проходите по 1 символу, для utf-8 (мультибайтовой кодировки) это не вполне верно:)
б) учитывая ru_RU.utf8 setlocale надо задавать как setlocale(LC_ALL,'ru_RU.utf8'); убедитесь что не пишите как setlocale(LC_ALL,'ru_RU.utf-8'); например.

Написано более трёх лет назад
skvot @skvot Автор вопроса

Насчет for и мультибайтовой кодировки мне тоже так каказолсь =) Не подскажете более грамотного способа рабты с такой строкой? Разбить строку с помощью str_split() или есть более красивое решение?

Написано более трёх лет назад

DevMan @DevMan

как-то так:

for( $i = 0, $size = mb_strlen($a, 'UTF-8'); $i < $size; $i++ ) {
    echo mb_strtoupper( mb_substr( $a, $i, 1, 'UTF-8'), 'UTF-8' ) . PHP_EOL;
}

Написано более трёх лет назад

skvot @skvot Автор вопроса

Да, я уже нашел такой вариант на stackoverflow, в любом случае, спасибо!

Написано более трёх лет назад
Алексей Сундуков @alekciy

а) Он идет не по символам, а по байтам.

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 86 просмотров
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 196 просмотров
2

ответа
PHP

Средний
Как подключиться к серверу PHP и чтобы отображались исполнители?
- 1 подписчик
- 24 апр.
- 213 просмотров
3

ответа
PHP

Простой
Не работает яндекс ссылка прямая?
- 1 подписчик
- 07 апр.
- 202 просмотра
1

ответ
PHP

Простой
Почему слетает сайт при загрузке обработчика?
- 1 подписчик
- 02 апр.
- 227 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Авторизация вконтакте как настроить?
- 2 подписчика
- 26 мар.
- 379 просмотров
1

ответ
PHP

Простой
СТРОКА — где искать ее истоки на сайте?
- 1 подписчик
- 11 мар.
- 380 просмотров
2

ответа
PHP

Простой
Есть ли такая функция сравнения?
- 2 подписчика
- 09 мар.
- 328 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Как быть если ломается сайт, в зависимости от браузера?
- 1 подписчик
- 05 мар.
- 530 просмотров
1

ответ
PHP

Простой
Как отправить файл в Телеграм через OpenServer 6.5.0?
- 1 подписчик
- 02 мар.
- 249 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 15 000 до 250 000 ₽

Программист PHP

Базис-Центр • Коломна

от 70 000 до 250 000 ₽

PHP и Node.js разработчик

TripShock Adventures

от 1 000 до 2 500 $

Благодарю всех, кто помог мне разобраться в нужной проблеме.

Answer 1 · 2012-02-11 22:35:29

1) Не важно как красиво выглядит простая функция, если она работает и универсальна — этого достаточно.
2) А локаль utf-8 у Вас установлена? И правильно ли Вы ее называете при установке setlocale: locale -a в консоли проверьте.
3) Если у Вас пхп как модуль апача, то читайте варнинг к php.net/setlocale, по поводу того, что соседние потоки того же процесса могут менять локаль и для Вас, т.к. при такой конфигурации локаль глобальна.

Answer 2 · 2012-02-11 23:17:53

Я хочу добиться красивого кода, без использования multibyte функций и явного преобразования кодировки средствами iconv().

Фактически это означает, что вы хотите написать свой парсер utf-8 хотя бы для русского подмножества символов? :) Зачем?

Answer 3 · 2020-03-13 19:54:09

Как на счёт использования следующего класса: blog.ivru.net/?id=187

Примеры использования:
mystrto::lower("АБВГABCD"); результат: абвгabcd
mystrto::upper("абвгabcd"); результат: АБВГABCD.

Php работа с регистром русских символов в UTF-8?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт