С помощью каких библиотек можно было бы реализовать предобработку текста ?
Например:
1. Заменять сокращенные слова (тыс-тие - тысячелетие)
2. Различать даты, различать точки сокращения и конца предложения (07.11.2017 - переделать в "7 ноября 2017" года, т.е. - в "то есть")
3. различать количественные числительные (1-ый, 2-ой, 5-ый - переделать "в первый, второй, пятый")
4. чтение по буквам - (US - переделать в "ю эс")
и похожий функционал?
Alex004, возможно я ошибаюсь, но обычно готовые библиотеки существуют для парсинга например json xml и подобных. в вашем случае довольно легко написать свой парсер, что такое парсер читайте -> https://ru.wikipedia.org/wiki/%D0%A1%D0%B8%D0%BD%D...
Alex004, ну я советую использовать контейнер map, ключ у него будет ваш искомый символ, а в second например string(на что менять), с map скорость обработки будет быстра. а в самом тексте искать ячейку входа в нужное(ключ) слово через метод строки(string) find. find вам тут очень поможет)