Задать вопрос

alex-saratov

Алексей @alex-saratov

алгоритмы

Как правильно вычислить итоговую частотную составляющую для текста?

Есть CRM. Одной из ее функций является обработка текстовых сообщений.
Фильтрация сейчас происходит по среднему значению частотности стоп слов. Сейчас оно рассчитывается как сумма частот всех слов деленное на количество слов. Но результат не совсем верный. Особенно это видно на сообщениях до 7 слов, когда все слова кроме одного имеют 0 вес, а последнее слово столь часто встречается в СПАМ сообщениях, что в итоге сообщение не проходит.
Собирался отдать подготовленный результат нейросети, но пока не понял, что лучше подавать на вход.
Вопросы:
Какие есть алгоритмы, чтобы можно было правильно прогнозировать результат?
Может есть что почитать на эту темы?

Вопрос задан более трёх лет назад
129 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Алгоритмы и структуры данных

4 месяца

Далее
Skillbox

Алгоритмы и структуры данных для разработчиков

3 месяца

Далее
Stepik

Алгоритмы и структуры данных

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 1

xmoonlight

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

Пользуюсь готовым инструментом: stumper.ru/use/isText

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 307 просмотров
1

ответ
Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт.
- 263 просмотра
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт.
- 174 просмотра
2

ответа
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 129 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 104 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 92 просмотра
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 200 просмотров
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт.
- 167 просмотров
0

ответов
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 77 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт.
- 323 просмотра
1

ответ
Показать ещё Загружается…

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

Инженер по автоматизации

Алабуга • Екатеринбург

от 127 500 ₽