Задать вопрос
@Cruper
web-падаван

Какой лучший способ определить ключевые слова?

Как в потоке сообщений лучше всего определить ключевые слова сообщений, чтобы потом искать "похожие"?
На примере аггрегаторов новостей, где сообщения объединяются в сюжеты.
Желательно на Python.
Сейчас использую библиотеки spaCy и Textacy для выделения ключевых слов. Дальше ищу пересечения и сортирую в порядке возрастания суммарного веса совпадающих ключевых слов.
key_terms = textacy.keyterms.key_terms_from_semantic_network(doc,
                                                                             normalize=normalize,
                                                                             window_width=15,
                                                                             n_keyterms=30)

Но точность сильно хромает
  • Вопрос задан
  • 159 просмотров
Подписаться 2 Простой Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 дек. 2024, в 10:44
15000 руб./за проект
22 дек. 2024, в 10:12
10000 руб./за проект
22 дек. 2024, в 09:51
3000 руб./за проект