Ошибка в подсчете символов, что делать?

Question

dmitrii000 @dmitrii000

C++

Ошибка в подсчете символов, что делать?

есть код, который должен из текста, который пишет пользователь, считать количество русских букв, однако он не правильно это делает, что не так?

#include <iostream>
#include <string>
#include <vector>

int main() {
    setlocale(LC_ALL, "RU");
    std::string input;
    std::vector<char> charVector;
    int count = 0;

    std::cout << "ctrl + z 4 end read" << std::endl;

    std::string line;
    while (std::getline(std::cin, line)) {
        input += line;
    }

    for (char c : input) {
        charVector.push_back(c);
    }

    for (int i = 0; i < charVector.size(); i++) {
        if (charVector[i] == 'а' || charVector[i] == 'б' || charVector[i] == 'в' || charVector[i] == 'г' || charVector[i] == 'д' ||
            charVector[i] == 'е' || charVector[i] == 'ё' || charVector[i] == 'ж' || charVector[i] == 'з' || charVector[i] == 'и' ||
            charVector[i] == 'й' || charVector[i] == 'к' || charVector[i] == 'л' || charVector[i] == 'м' || charVector[i] == 'н' ||
            charVector[i] == 'о' || charVector[i] == 'п' || charVector[i] == 'р' || charVector[i] == 'с' || charVector[i] == 'т' ||
            charVector[i] == 'у' || charVector[i] == 'ф' || charVector[i] == 'х' || charVector[i] == 'ц' || charVector[i] == 'ч' ||
            charVector[i] == 'ш' || charVector[i] == 'щ' || charVector[i] == 'ъ' || charVector[i] == 'ы' || charVector[i] == 'ь' ||
            charVector[i] == 'э' || charVector[i] == 'ю' || charVector[i] == 'я') {
            count++;
        }
    }

    std::cout << "count rusbukv " << count << std::endl;

    return 0;
}

Вопрос задан более года назад
90 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++: Профессия + специализация + нейросети

12 месяцев

Далее
Skillbox

Разработчик на C++

7 месяцев

Далее
Яндекс Практикум

Разработчик C++

9 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Почему не работает передача контекста между приложениями?
- 1 подписчик
- 23 часа назад
- 57 просмотров
1

ответ
C++

Простой
Какой контейнер выбрать для поиска по ключу для разных размеров?
- 2 подписчика
- 14 дек.
- 143 просмотра
0

ответов
C++

+2 ещё

Простой
Как прочитать данные из пайпа в C++ не перепутав с TTY stdin?
- 1 подписчик
- 14 дек.
- 90 просмотров
1

ответ
C++

Простой
Почему function wrapper с ссылкой в сигнатуре может принимать pointer to member function?
- 1 подписчик
- 11 дек.
- 76 просмотров
0

ответов
C++

Простой
Как лучше реализовать асинхронную задержку?
- 2 подписчика
- 04 дек.
- 212 просмотров
2

ответа
C++

+2 ещё

Простой
Как скомпилировать рабочую dll библиотеку?
- 3 подписчика
- 26 нояб.
- 333 просмотра
1

ответ
C++

+1 ещё

Простой
Как узнать, хранятся числа в компьютере в прямом, дополнительном или обратном коде?
- 1 подписчик
- 23 нояб.
- 477 просмотров
6

ответов
C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб.
- 487 просмотров
5

ответов
C++

+1 ещё

Простой
Почему Project Dependencies не работает?
- 1 подписчик
- 10 нояб.
- 101 просмотр
1

ответ
C++

Простой
Влияет ли, передаёшь ты в функцию аргументы по ссылке или по значению, на производительность и память?
- 2 подписчика
- 07 нояб.
- 364 просмотра
2

ответа
Показать ещё Загружается…

Инженер

Ростелеком • Москва

от 73 560 до 94 700 ₽

Инженер оборудования связи

Ростелеком • Москва

от 69 900 до 89 950 ₽

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

Answer 1 · 2024-02-07 21:17:32

Для кодирования символов за пределами таблицы ASCII, обычно, используется юникод, в котором символы имеют коды различной длины. Кириллица же, никак не уместится в один байт, поэтому у вас в векторе абсолютный мусор.
Используйте wchar и wstring
Или не мучайтесь и возьмите библиотеку, например, эту
https://github.com/nemtrif/utfcpp

Ссылка на таблицу символов юникод для ознакомления
https://symbl.cc/en/unicode/table/#cyrillic

Answer 2 · 2024-02-07 21:15:55

считать количество русских букв, однако он не правильно это делает, что не так?

считать русские буквы сложно, твой код зависит от кодировки и в любой не-однобайтной кодировке этот код не будет работать правильно. Проще всего, мне кажется, выкинуть charVector и весь код связанный с ним, а оставшееся переписать следующим образом:

setlocale(LC_ALL, "");

const char *str = input.c_str();

while (*str) {
    wchar_t c;
    int n = mbtowc(&c, str, MB_CUR_MAX);

    if (n < 0)
        break;
    if (wcschr(L"абвгд...юя", c))
        ++count;
    str += n;
}

Ошибка в подсчете символов, что делать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт