Задать вопрос

Werawoolf

Вадим @Werawoolf

Frontend Engineer

javascript

Как прочитать, что происходит в данной реализации DQN алгоритма на TensorFlowJS?

Привет,

Я нашел несколько примеров реализации DQN, но, поскольку я не эксперт по TensorFlow или Машинному обучению, я немного запутался. https://dumpz.org/c77HNAA4XxGF вот один из них.

Я понимаю что, в 73-й строке мы берем некоторый кусок данных: [{state, action, reward, newState, done}] если быть точным, затем получаем currentStates, который равен [[state1, state2, ...]], затем на 75 мы используем модель для получения currentQs, которые равны, насколько я понимаю, [[act1, act2, ...]], потому что наша модель используется для получения действия от состояния среды. То же самое происходит с newCurrentStates и futureQs.

Но затем на 88 мы видим let maxFutureQ = Math.max (futureQs);. Что здесь происходит? futureQs - это массив массивов с вероятностями действий для каждого futureState? И тогда maxFutureQ должен быть вероятностью действия, почему тогда мы складываем это с наградой? Эта часть меня сбивает с толку.

Также я не могу понять, почему нам нужно делать currentQ [action] = newQ; на 94. Мы же в итоге все равно потеряем эту часть, нет?

Может кто-нибудь помочь мне понять, что здесь происходит и, может быть, оставить комментарии к строкам?

Заранее спасибо.

Вопрос задан более трёх лет назад
41 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+1 ещё

Простой
Как отправлять браузерные уведомления через скрипт js?
- 1 подписчик
- вчера
- 90 просмотров
0

ответов
JavaScript

+1 ещё

Простой
Существуют ли годные современные курсы по PIXI.js?
- 1 подписчик
- 31 июл.
- 135 просмотров
0

ответов
JavaScript

Простой
Как написать регулярное выражение для поиска имени файла в теге img?
- 1 подписчик
- 30 июл.
- 125 просмотров
1

ответ
JavaScript

Простой
Как реализовать библиотеку классов на JavaScript?
- 1 подписчик
- 29 июл.
- 1070 просмотров
2

ответа
JavaScript

Простой
Как сделать lazy load pdf?
- 1 подписчик
- 28 июл.
- 186 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 32 просмотра
1

ответ
JavaScript

+3 ещё

Простой
Почему при отправке HTML-формы данные не поступают в mysql?
- 1 подписчик
- 25 июл.
- 232 просмотра
1

ответ
JavaScript

Простой
Как получить переменную из esm-модуля?
- 1 подписчик
- 24 июл.
- 148 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Как сделать так чтоб push уведомления отправлялись в фоне при открытом но неактивном pwa приложении?
- 2 подписчика
- 24 июл.
- 107 просмотров
0

ответов
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 50 просмотров
0

ответов
Показать ещё Загружается…

HTML-верстальщик (HTML/CSS/JavaScript)

CleanTalk

от 100 000 ₽

Fullstack JavaScript разработчик

Wanted

от 180 000 до 240 000 ₽

Разработчик виджетов для CRM (Битрикс24, АМО и другие) из Чебоксар

МИНТА • Чебоксары

от 50 000 ₽