Как получить список слов часто встречающихся в тексте?

Question

MegaMufa @MegaMufa

Алгоритмы

Как получить список слов часто встречающихся в тексте?

Есть текст. Нужно разобрать его и вывести список слов, которые в нем встречаются и количество их вхождений. При этом нужен "умный" поиск, что бы учитывал словоформы и в результат они записывались в инфинитиве.

Не подскажите, как называется эта процедура? Или какие есть библиотеку для этого? Язык не важен, но предпочтительны PHP/Python/Java/Scala

Вопрос задан более трёх лет назад
4308 просмотров

Комментировать

Подписаться 6 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Алгоритмы и структуры данных для разработчиков

3 месяца

Далее
Яндекс Практикум

Алгоритмы и структуры данных

4 месяца

Далее
Stepik

Алгоритмы и структуры данных

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт.
- 288 просмотров
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт.
- 204 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 206 просмотров
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт.
- 176 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт.
- 343 просмотра
1

ответ
Алгоритмы

+1 ещё

Простой
Как отконвертировать 3D-меш в наклонные треугольники?
- 2 подписчика
- 02 окт.
- 182 просмотра
1

ответ
Алгоритмы

Сложный
Поиск оптимального маршрута с наимешьшим влиянием на цену в сети ethereum?
- 1 подписчик
- 29 авг.
- 157 просмотров
2

ответа
Алгоритмы

Простой
Как можно еще уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- 22 авг.
- 244 просмотра
2

ответа
Алгоритмы

Простой
Как можно уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- 19 авг.
- 192 просмотра
2

ответа
Алгоритмы

+1 ещё

Простой
Как в квантовый компьютер вводятся данные?
- 1 подписчик
- 12 авг.
- 316 просмотров
3

ответа
Показать ещё Загружается…

Разработчик Blender / 3D Technical Artist

Академия Компьютерных Технологий и Дизайна

от 94 000 ₽

Backend developer/ software engineer (Python) в команду DCIM

Яндекс • Москва

от 350 000 ₽

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Answer 1 · 2014-05-19 14:14:17

Посмотрите на Sphinx (sphinxsearch.com/).
Процедура приведения словоформы к нормальному виду называется нормализацией (морфологическая задача). С ней хорошо может справиться и AOT (aot.ru). Для ХОРОШЕГО поиска нужно использовать уже движки (Sphinx и прочие). У Sphinx в результатах возвращается статистика по словам.

Answer 2 · 2014-05-19 14:39:43

Павел Соловьёв @pavel_salauyou

Symfony2 & Angular разработчик

для этого нужно использовать elasticsearch и фасеты

Ответ написан более трёх лет назад

Комментировать

Answer 3 · 2018-07-27 23:55:10

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

тут

Ответ написан более трёх лет назад

Комментировать

Как получить список слов часто встречающихся в тексте?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт