Задать вопрос

Prizm @PrizmMARgh

нейронные-сети

Как реализовать обучение с подкреплением с данными инструментами?

У меня уже есть:

Класс нейронной сети типа feed-forward (со встроенным расчётом градиента на произвольной модели и пр.
Класс pair data (пар данных для обучения с учителем)
Класс поля крестиков-ноликов с методами для стандартного хода (по номеру клетки), методом getNextStates(), который возвращает список возможных будущих состояний (соответственно, крестики и нолики меняются местами, чтобы поле было "от лица соперника"), методом getAsVector(), который возвращает состояние поля в виде вектора 9 значений +-1 или 0 в зависимости от того, что находится в клетке.

Так вот - как правильно обучить бота для крестиков-ноликов обучением с подкреплением? (при условии, что ход нейросети будет заключаться в подсчёте V-функции для всех будущих состояний доски и выборе "наихудшего" с точки зрения соперника состояния).

P.S. Я не использую какие-либо библиотеки, поэтому приводите, пожалуйста алгоритм на псевдокоде.

Вопрос задан более трёх лет назад
31 просмотр

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 32 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 50 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 51 просмотр
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 49 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 191 просмотр
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 107 просмотров
1

ответ
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 134 просмотра
3

ответа
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 58 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 70 просмотров
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 198 просмотров
4

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Эксперт по транспортной сети/Сетевой инженер

НТЦ ПРОТЕЙ • Санкт-Петербург

от 200 000 ₽

Сетевой инженер

МТС • Владивосток

от 100 000 ₽