Задать вопрос

Артем @Cruper

web-падаван

обработка-естественного-языка

Обработка естественного языка

Какой лучший способ определить ключевые слова?

Как в потоке сообщений лучше всего определить ключевые слова сообщений, чтобы потом искать "похожие"?
На примере аггрегаторов новостей, где сообщения объединяются в сюжеты.
Желательно на Python.
Сейчас использую библиотеки spaCy и Textacy для выделения ключевых слов. Дальше ищу пересечения и сортирую в порядке возрастания суммарного веса совпадающих ключевых слов.

key_terms = textacy.keyterms.key_terms_from_semantic_network(doc,
                                                                             normalize=normalize,
                                                                             window_width=15,
                                                                             n_keyterms=30)

Но точность сильно хромает

Вопрос задан более трёх лет назад
160 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Графический дизайнер PRO

15 месяцев

Далее
Нетология

Фронтенд-разработчик

11 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Обработка естественного языка

Средний
Как создать мультипризнаковую мноклассовую модель классификации текстов?
- 3 подписчика
- 17 мая
- 1141 просмотр
0

ответов
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 102 просмотра
1

ответ
Регулярные выражения

+2 ещё

Простой
Поиск оптимальной регулярки для бинарной классификации строк. Как?
- 1 подписчик
- 22 мар.
- 200 просмотров
1

ответ
Алгоритмы

+1 ещё

Средний
Какие есть Алгоритмы поиска синонимов?
- 3 подписчика
- 21 мар.
- 1686 просмотров
3

ответа
Машинное обучение

+1 ещё

Простой
Какой датасет лучше для обучения?
- 2 подписчика
- 17 янв.
- 187 просмотров
1

ответ
Искусственный интеллект

+2 ещё

Простой
Как исправить ошибку, возникающую при загрузке модели в rust_bert без файла vocab.txt?
- 1 подписчик
- более года назад
- 61 просмотр
1

ответ
Обработка естественного языка

Средний
Почему модель llama предсказывает только один класс?
- 2 подписчика
- более года назад
- 150 просмотров
1

ответ
Обработка естественного языка

+1 ещё

Простой
Как провести многоэтапную проверку текста через LLama3?
- 1 подписчик
- более года назад
- 64 просмотра
1

ответ
Машинный перевод с одного языка на другой

+1 ещё

Простой
Есть ли такая модель для word embedding?
- 3 подписчика
- более года назад
- 85 просмотров
0

ответов
Python

+1 ещё

Простой
Как сделать, чтобы мой дискорд бот мог общаться с пользователями?
- нет подписчиков
- более года назад
- 371 просмотр
1

ответ
Показать ещё Загружается…

SRE/DevOps инженер

Сбер • Москва

от 200 000 до 300 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 400 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽