Сложно ли тематически сортировать сообщения/посты в неком потоке?

Question

Тарас Лабяк @kissarat

Node.js

Сложно ли тематически сортировать сообщения/посты в неком потоке?

Допустим есть вконтакте ряд пабликов/групп/людей (ряд стен), которые периодически обновляються. Задача на основании потока постов и некой дополнительной иформации о стене определеть тематику сообщения (есть фиксированый список тем, по которым нужно классифицировать) и определить являеться ли пост предложениям работы, предложения выполнить некий проект или задания, покупки или продажы.
Вопрос сложно ли осуществлять такую классификацию и какими методами/алгоритмы ИИ это можно делать. Необходимо показывать эти сообщения конечному пользователю, который выбрав интересующеюю его тематику и видит только соответсвующие ей посты. Вероятность ложной класификации по теме и полезности (являеться ли это предложения чего-то) должна быть меньше 50%.
Насколько сложнее будет сделать вероятность ошибки меньше 10%? Сложно ли сделать алгоритм обучаемым, чтобы вероятность ложного срабатывания со временем уменьшалась?
Вконтакте указано для примера. Технические вопросы как сканировать большое количество и каких пабликов не рассматривать

Вопрос задан более трёх лет назад
466 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Продвижение ВКонтакте 2.0

2 месяца

Далее
Stepik

Основы SMM ВКонтакте без "воды" с нуля до специалиста

1 неделя

Далее
Нетология

SMM-менеджер

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 220 просмотров
1

ответ
Искусственный интеллект

Простой
Как сделать синхронный перевод с английского на русский, локально?
- 3 подписчика
- 06 дек.
- 280 просмотров
1

ответ
Искусственный интеллект

Простой
Сравнение стилей двух разных текстов: один или разные люди их писали или вообще ИИ?
- 2 подписчика
- 05 дек.
- 179 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Какую нейронку с API (чтоб оплата принималась в рублях) выбрать?
- 3 подписчика
- 22 нояб.
- 434 просмотра
3

ответа
JavaScript

+2 ещё

Простой
Как получить события VK.VideoPlayer используя JS?
- 1 подписчик
- 11 нояб.
- 218 просмотров
1

ответ
Искусственный интеллект

Простой
Как скормить весь проект нейросети (grok, chatgpt, deepseek) чтобы она понимала в нём и чтоб можно было просить ее доработать что -то?
- 1 подписчик
- 02 нояб.
- 562 просмотра
4

ответа
Google

+1 ещё

Простой
Бесплатная альтернатива Gemini 2.0 Flash preview image generation?
- 3 подписчика
- 28 окт.
- 274 просмотра
2

ответа
Telegram

+2 ещё

Простой
Как настроить репост из телеграм канала в вк группу?
- 2 подписчика
- 21 окт.
- 305 просмотров
1

ответ
PHP

+2 ещё

Простой
Как проще отправить изображение на стену канала?
- 1 подписчик
- 15 окт.
- 206 просмотров
1

ответ
Железо

+3 ещё

Простой
Какие есть готовые умные очки, которые можно прошить?
- 2 подписчика
- 15 окт.
- 367 просмотров
1

ответ
Показать ещё Загружается…

Главный менеджер управления поддержки продаж сети

ПСБ цифровая лаборатория • Москва

от 110 000 до 130 000 ₽

Аналитик-разработчик (команда Intelligent Search)

Сбер • Москва

от 250 000 до 400 000 ₽

Java разработчик

SENSE

До 450 000 ₽

Answer 1 · 2017-03-31 21:42:19

То, о чем вы пишете уже вполне себе реализовано например вот этими ребятами - shikari.do
Насколько это сложно не скажу, но раз есть, то вполне возможно и на первый взгляд ошибка сильно меньше 10%.

Answer 2 · 2017-04-18 17:11:47

Наверное, неактуально, но - задача же сводится к классификации (возможно - кластеризации) текстов?
Если первое - возможно стоит смотреть в сторону abbyy smartclassifier (возможно уже добавились и новые готовые классификаторы с поддержкой русского языка).

з.ы. попадались посты от https://habrahabr.ru/users/ServPonomarev/ . Моя череззадная реализация https://github.com/alex4321/w2v-cluster-distance-c... таки работала на небольшом наборе данных (судя по его постам - алгоритм должен работать и на больших наборах). Впрочем, использовать её я, конечно, не рекомендую :-)

з.ы.2. что до "Сложно ли сделать алгоритм обучаемым, чтобы вероятность ложного срабатывания со временем уменьшалась?" - в случае подобного вышеуказанному - это не должно стать большой сложностью (разумеется - потребуется добавить пример в датасет и провести переобучение), в случае ИНС - возможно, понадобится менять её конфигурацию.

Сложно ли тематически сортировать сообщения/посты в неком потоке?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт