Задать вопрос

Werawoolf

Вадим @Werawoolf

Frontend Engineer

javascript

Как прочитать, что происходит в данной реализации DQN алгоритма на TensorFlowJS?

Привет,

Я нашел несколько примеров реализации DQN, но, поскольку я не эксперт по TensorFlow или Машинному обучению, я немного запутался. https://dumpz.org/c77HNAA4XxGF вот один из них.

Я понимаю что, в 73-й строке мы берем некоторый кусок данных: [{state, action, reward, newState, done}] если быть точным, затем получаем currentStates, который равен [[state1, state2, ...]], затем на 75 мы используем модель для получения currentQs, которые равны, насколько я понимаю, [[act1, act2, ...]], потому что наша модель используется для получения действия от состояния среды. То же самое происходит с newCurrentStates и futureQs.

Но затем на 88 мы видим let maxFutureQ = Math.max (futureQs);. Что здесь происходит? futureQs - это массив массивов с вероятностями действий для каждого futureState? И тогда maxFutureQ должен быть вероятностью действия, почему тогда мы складываем это с наградой? Эта часть меня сбивает с толку.

Также я не могу понять, почему нам нужно делать currentQ [action] = newQ; на 94. Мы же в итоге все равно потеряем эту часть, нет?

Может кто-нибудь помочь мне понять, что здесь происходит и, может быть, оставить комментарии к строкам?

Заранее спасибо.

Вопрос задан более трёх лет назад
43 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Веб-разработчик

12 месяцев

Далее
Академия Eduson

Fullstack-разработчик на JavaScript

11 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

Простой
Как создать рисунок из PHP в Fabric.js?
- 2 подписчика
- 28 окт.
- 109 просмотров
1

ответ
JavaScript

+1 ещё

Простой
Какой скрипт загружает меню в Ютуб?
- 2 подписчика
- 27 окт.
- 209 просмотров
2

ответа
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 113 просмотров
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 92 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 85 просмотров
2

ответа
JavaScript

Простой
Как работать с разрозненными данными?
- 1 подписчик
- 21 окт.
- 233 просмотра
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 67 просмотров
0

ответов
JavaScript

+1 ещё

Простой
Неправильно работает crypto.subtle.deriveKey в Firefox, баг или мой косяк?
- 2 подписчика
- 16 окт.
- 135 просмотров
0

ответов
JavaScript

Простой
Как подгружать xml с перерисовкой таблицы?
- 3 подписчика
- 14 окт.
- 189 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт.
- 260 просмотров
1

ответ
Показать ещё Загружается…

Fullstack Разработчик (Next.js / JavaScript / TypeScript)

App Company

от 200 000 до 300 000 ₽

Web-разработчик/WordPress программист (Full-stack)

JustBusiness • Санкт-Петербург

от 130 000 до 150 000 ₽

Верстальщик / фронтендер для браузерного расширения

DevTeam.Space

от 1 000 до 2 000 $