Как получить число символов в Unicode строке в bash?

Question

Сергей Соколов @sergiks

♬♬

Как получить число символов в Unicode строке в bash?

Строка содержит кириллицу и английские буквы. Как в bash-скрипте получить число букв?

Например:
TEST="йцукенasdf"
Нужно получить 10.

Пробовал:

CHRLEN=$(wc -m <<< $TEST)
printf "%s has %d characters\n" "$TEST" "$CHRLEN"

Почему-то показывает 11, на 1 больше, чем правда.

CHRLEN=${#TEST}
возвращает 16 – кириллицу считает один за два.

Вопрос задан более трёх лет назад
1250 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Linux для робототехников

3 месяца

Далее
Stepik

Основы Linux

2 недели

Далее
Учебный центр IBS

AL-1801 ОС Astra Linux Special Edition 1.8 для пользователей

1 неделя

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 2

3 комментария

Сергей Соколов @sergiks Автор вопроса
от чего это зависит? Может, эти все настройки окружения? У меня такие на маке:
LC_CTYPE=UTF-8 __CF_USER_TEXT_ENCODING=0x1F5:0x0:0x0 LANG=en_RU.UTF-8

и на Linux:
LANG=en_RU.UTF-8 LESSCHARSET=utf-8
Написано более трёх лет назад
Сергей Соколов @sergiks Автор вопроса

на Linux'овой коробке и на домашнем маке этот код выдаёт 16 : (

Написано более трёх лет назад
Saboteur @saboteur_kiev Куратор тега Linux

тогда просто отнимайте единичку от того, что вам возвращает wc

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

Простой
Как запустить Linux с iGPU?
- 1 подписчик
- 4 часа назад
- 55 просмотров
1

ответ
Linux

+2 ещё

Простой
Эмулятор android для linux?
- 1 подписчик
- 18 дек.
- 796 просмотров
4

ответа
Linux

+2 ещё

Простой
Настройка трёх сетевых карт Debian systemd-networkd?
- 1 подписчик
- 11 дек.
- 288 просмотров
1

ответ
Linux

+1 ещё

Простой
Не работает apt update && apt upgrade в Kali Linux. Что делать?
- 2 подписчика
- 04 дек.
- 579 просмотров
2

ответа
Linux

+1 ещё

Простой
На чем практиковаться начинающему админу?
- 3 подписчика
- 30 нояб.
- 1181 просмотр
3

ответа
Linux

+2 ещё

Простой
В shinobi отображаются видео только за 24 часа, как увидеть все?
- 3 подписчика
- 27 нояб.
- 251 просмотр
0

ответов
macOS

+1 ещё

Сложный
Возможно сделать чтобы каждый профиль Safari работал со своим прокси?
- 1 подписчик
- 26 нояб.
- 88 просмотров
1

ответ
macOS

+2 ещё

Простой
Как выровнять курсор на Mac когда использую несколько мониторов с разным разрешением?
- 1 подписчик
- 25 нояб.
- 155 просмотров
1

ответ
Linux

+1 ещё

Средний
Почему не монтируются сетевые шары при VPN?
- 3 подписчика
- 23 нояб.
- 853 просмотра
1

ответ
Linux

+2 ещё

Средний
StrongSwan IKEv2/IPSec и fail2ban, как правильно настроить?
- 2 подписчика
- 22 нояб.
- 519 просмотров
0

ответов
Показать ещё Загружается…

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

Специалист первой линии технической поддержки

Петрович-Тех

До 52 882 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Answer 1 · 2017-10-01 10:37:59

Почему-то показывает 11, на 1 больше, чем правда.

оно считает еще перенос строки как символ

возвращает 16 – кириллицу считает один за два.

добавьте тогда просто нужную кодировку перед командой, например:
LANG=ru_RU.UTF-8 CHRLEN=$(echo -n $TEST | wc -m)
или
LANG=ru_RU.UTF-8 echo ${#TEST}
из приведённых выше примеров

Answer 2 · 2017-09-30 23:54:07

Saboteur @saboteur_kiev Куратор тега Linux

software engineer

$ TEST="йцукенasdf"
$ echo ${#TEST}
10

Ответ написан более трёх лет назад

3 комментария

Answer 3 · 2017-10-01 00:29:04

<<< добавляет в конец символ перевода строки.

CHRLEN=$(echo -n $TEST | wc -m)
printf "%s has %d characters\n" "$TEST" "$CHRLEN"

Как получить число символов в Unicode строке в bash?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт