Yourmind
@Yourmind
пишу говнокод в перерывах между едой и сериалами

Как проклассифицировать пост в социальной сети?

Доброго времени суток
У меня стоит задача выявления негативных постов в социальных сетях
Допустим я беру и обучаю свою модель по готовым датасетам для классификации текста поста
Также обучаю другую модель для классификации изображения там
А как теперь это связать не понимаю
Ещё к посту есть инфа о названии группы где он выложен, дате, количестве лайков и репостов
И хочется эти данные тоже как то в анализе заюзать
Но готового датасета под это нет а размечать все ручками очень скучно и долго
Как бы вы сделали в данном случае
  • Вопрос задан
  • 93 просмотра
Пригласить эксперта
Ответы на вопрос 1
@dmshar
Ваш вопрос как-то уж очень сумбурный.
Что удалось из него понять.
1. Вы умеете выявлять тональность текста. Предположим - "негатив-позитив". Скорее всего результат можно нормировать в диапазон (-1;+1)
2. Вы умеете классифицировать изображения "там" (кстати - где "там"?) Ну, проклассифицировали по классам. Может по дихотомическим, может по множественным. Получили некоторую оценку принадлежности к классу, которые сами предварительно выделили. В любом случае полученную оценку можно при необходимости нормировать.
3. Что с чем связывать вы собрались? Если предположить, что и первая и вторая задача разбрасывала ваши посты по классам - то тогда вы теперь можете перейти к классической многомерной (а очень похоже - что всего-лишь двумерной) задаче классификации, которую можно решить любым известным методом. Правда, придется перепробовать разные методы, так-как универсального нет. Но есть надежда, что что-нибудь в диапазоне от kNN до случайного леса вам да и подойдет.
4. Если есть добавочная информация - ну в худшем случае это увеличит количество признаков, с которыми работает классификатор.
5. Как нет готового датасета? Вы же написали "я беру и обучаю свою модель по готовым датасетам". Т.е. есть датасет постов с текстами, очевидно - и с картинками, причем раз вы уже обучили - то значит он размеченный. И вы же сами пишете "к посту есть инфа о названии группы где он выложен, дате, количестве лайков и репостов". Ну не отбрасывайте эту информацию, а вместе с результатами сентиментного анализа и классификации изображений передавайте на конечный, обобщающий классификатор. Проблема-то в чем?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы