FudoTsu
@FudoTsu
Разработчик - java, php,js,jquery,nodejs,c#,css

LUA | Подсчет русских символов?

Вот столкнулся с проблемой ...
При подсчете юникода (к примеру "яляя"),он выдает не 4 а 8. Я знаю что в русском символе 2 байта, и пробовал делить на 2 ... Но есть другая проблема - если в тексте будут англ. буквы или пробелы, то этот способ сразу отпадает...
  • Вопрос задан
  • 857 просмотров
Пригласить эксперта
Ответы на вопрос 3
2ord
@2ord
Для подсчёта кириллических знаков нужно определить знаки, у которых кодовые позиции (code point) находятся в диапазоне U+0410 - U+044F, не включая ё (U+0451), Ё (U+0401).
Кроме того, утверждение не всегда верно
Я знаю что в русском символе 2 байта
поскольку это является частным случаем, зависящим от выбора кодировки.
Ответ написан
Комментировать
dollar
@dollar Куратор тега Lua
Делай добро и бросай его в воду.
Можно использовать расширение utf8 для Lua.
Например, это https://github.com/starwing/luautf8
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы