Задать вопрос
asyaevloeva
@asyaevloeva

Библиотеки C++ для обработки текста?

Хотелось бы узнать есть ли какие-нибудь библиотеки или готовые решения для того, чтобы делать предобработку текста (удалять стоп-слова, приводить слова к начальной форме, удалять знаки препинания, искать keywords и тд)? Просто в R полно библиотек и готовых решений, а вот на С++ я не смогла найти ничего подходящего...
  • Вопрос задан
  • 390 просмотров
Подписаться 1 Оценить 8 комментариев
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Разработчик C++
    9 месяцев
    Далее
  • Нетология
    Специалист по информационной безопасности + нейросети
    12 месяцев
    Далее
  • Компьютерная академия «TOP»
    Учебная программа “Разработка программного обеспечения”
    30 месяцев
    Далее
Решения вопроса 1
удалять стоп-слова, удалять знаки препинания, искать keywords

это точно можно решить с помощью регулярок.
doc.qt.io/qt-4.8/qregexp.html
en.cppreference.com/w/cpp/regex

приводить слова к начальной форме

а вот с этим не уверен

p.s.: лично мне когда-то вот эта статья помогла разобраться с регулярками, хоть и написана в контексте javascript.
https://habrahabr.ru/post/242695/

и вот этот ресурс еще порекомендовать могу. очень помогает при составлении и отладке регулярок.
https://regex101.com
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы