Как обучать нейронную сеть для предсказаний действия агента?

Question

kiling @kiling

Как обучать нейронную сеть для предсказаний действия агента?

Я начал изучать машинное обучение. Для этого я использую python и scikit-learn.

Есть задача в которой мне нужно предсказать действие агента. Входные данные описывают ситуацию. У агента есть два возможных действия, которые являются реакцией на описываемую ситуацию. Агент может совершить только одно действие.
1 0 - агент совершил первое действие.
0 1 - агент совершил второе действие.

После обучения я хочу получить вероятности совершения действия агента на событие. Т.е. если я на событие получу ответ - 0.3 0.7, это означает предсказание действий агента в котором предсказывается что 1 действие агент совершит с вероятностью 30%, а второе действие соответственно с вероятностью 70%.

Я для обучения пробовал применять разные регрессионные модели, например LinearRegression или RandomForestRegressor. В результате я вроде даже получаю данные нужного вида.

Так вот вопрос, какие модели обучения правильно применять для такой задачи. И самое главное как оценивать результат выполнения. Ведь если ответом будет предсказание 0.02 0.98, а агент все таки совершит первое действие (1 0), то это не ошибка, просто событие с малой вероятностью. Для моделей я как понимаю применяется оценка среднеквадратической ошибки. Такая оценка ведь не подходит для данной задачи?

Вопрос задан более трёх лет назад
334 просмотра

1 комментарий

Подписаться 2 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- 3 часа назад
- 76 просмотров
0

ответов
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- 11 часов назад
- 27 просмотров
1

ответ
Python

+1 ещё

Простой
Как настроить группы при создании нового пользователя в битриксе?
- 1 подписчик
- вчера
- 97 просмотров
0

ответов
Python

+1 ещё

Простой
При добавления строчки @commands.has_permissions в терминале при запуске выдает ошибку?
- 1 подписчик
- вчера
- 80 просмотров
0

ответов
Python

+1 ещё

Простой
Можно ли отключить SSL сертификат при парсинге?
- 1 подписчик
- 13 авг.
- 115 просмотров
0

ответов
Python

Простой
Не работает код, что делать?
- 2 подписчика
- 10 авг.
- 2075 просмотров
4

ответа
Python

Простой
Почему консольная программа перестает работать спустя время?
- 3 подписчика
- 08 авг.
- 2287 просмотров
3

ответа
Python

Простой
Как делать удаленную печать на python?
- 1 подписчик
- 08 авг.
- 155 просмотров
2

ответа
Python

Простой
Как импортировать модуль из git?
- 2 подписчика
- 07 авг.
- 173 просмотра
0

ответов
Python

+3 ещё

Простой
Как с помощью Kaspersky Security Center запустить скрипт?
- 1 подписчик
- 04 авг.
- 181 просмотр
0

ответов
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

Вы не сказали самого главного - как описывается ситуация. Если вы внимательно изучаете МL, то наверняка обратили внимание, что для разных типов данных используется разные методы даже для решения одной и той-же (или подобной) целевой задачи.
Ну а оценка модели - смотрите в сторону темы "ROC-кривая" и производные от нее.

Answer 1 · 2019-09-03 14:49:28

Руслан . @LaRN

Senior Developer

Вот здесь посмотрите:
https://habr.com/ru/company/ods/blog/323890/

Похоже на логистическую регрессию.

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2019-09-03 17:54:38

На самом деле с точки зрения правильного статистика, вам нужна не только вероятность свершения данного события. Но и доверительный интервал данного свершения.
Т.о. ваша сеть может предсказать 1% за одно действие и 99% за другое .. но если произойдет первое, это не значит что сеть "ошиблась", просто она предсказала данный исход с вероятностью не 95% .. а 1% )

Как обучать нейронную сеть для предсказаний действия агента?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт