Задать вопрос

inalan @inalan

обработка-естественного-языка

Обработка естественного языка

Multi label emotion classification — BERT?

Мой датасет выглядит вот так:

sentence emotions
bla bla bla {'kind':105, 'sad':32, 'angry':5}
..... {'surprised': 65, 'kind': 10}

То есть, каждый пост имеет несколько эмоции например: kind:158, smile:32, angry:5 ...
Цифры рядом с эмоциями это количество людей у которых были вызваны данные эмоции.

По сути, моя цель - предсказать тип эмоций, которые может вызвать пост. и я собираюсь использовать трансформатор BERT с Deep Pavlov

Вопрос: Как быть в данном случае? Нормально ли давать BERTу данные в таком формате? Или лучше убрать цифры? или же оставить только ту эмоцию которое набрал максимальное количество голосов? у кого был похожий опыт, поделитесь пожалуйста.

Вопрос задан более трёх лет назад
53 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинный перевод с одного языка на другой

+1 ещё

Сложный
Кто писал собственный NLP-пайплайн перевода слов?
- 1 подписчик
- 19 мая
- 90 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Где найти мне датасет для обучения малюсенькой LLM?
- 2 подписчика
- 07 апр.
- 248 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Может, у кого-то есть дампы с реальными наименованиями товаров/услуг и кодами ОКПД2 для обучения NLP-модели?
- 1 подписчик
- 16 янв.
- 141 просмотр
0

ответов
Обработка естественного языка

Средний
Как создать мультипризнаковую мноклассовую модель классификации текстов?
- 4 подписчика
- более года назад
- 1160 просмотров
0

ответов
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- более года назад
- 114 просмотров
1

ответ
Регулярные выражения

+2 ещё

Простой
Поиск оптимальной регулярки для бинарной классификации строк. Как?
- 1 подписчик
- более года назад
- 211 просмотров
1

ответ
Алгоритмы

+1 ещё

Средний
Какие есть Алгоритмы поиска синонимов?
- 3 подписчика
- более года назад
- 1712 просмотров
3

ответа
Машинное обучение

+1 ещё

Простой
Какой датасет лучше для обучения?
- 2 подписчика
- более года назад
- 195 просмотров
1

ответ
Искусственный интеллект

+2 ещё

Простой
Как исправить ошибку, возникающую при загрузке модели в rust_bert без файла vocab.txt?
- 1 подписчик
- более года назад
- 73 просмотра
1

ответ
Обработка естественного языка

Средний
Почему модель llama предсказывает только один класс?
- 2 подписчика
- более года назад
- 159 просмотров
1

ответ
Показать ещё Загружается…