asyaevloeva
@asyaevloeva

Библиотеки C++ для обработки текста?

Хотелось бы узнать есть ли какие-нибудь библиотеки или готовые решения для того, чтобы делать предобработку текста (удалять стоп-слова, приводить слова к начальной форме, удалять знаки препинания, искать keywords и тд)? Просто в R полно библиотек и готовых решений, а вот на С++ я не смогла найти ничего подходящего...
  • Вопрос задан
  • 382 просмотра
Решения вопроса 1
удалять стоп-слова, удалять знаки препинания, искать keywords

это точно можно решить с помощью регулярок.
doc.qt.io/qt-4.8/qregexp.html
en.cppreference.com/w/cpp/regex

приводить слова к начальной форме

а вот с этим не уверен

p.s.: лично мне когда-то вот эта статья помогла разобраться с регулярками, хоть и написана в контексте javascript.
https://habrahabr.ru/post/242695/

и вот этот ресурс еще порекомендовать могу. очень помогает при составлении и отладке регулярок.
https://regex101.com
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы