Как научить нейронку выигрывать в моей Phaser.js игре?

Question

Teleweb developer @vool

Разработчик

Как научить нейронку выигрывать в моей Phaser.js игре?

Привет, я разработал свою небольшую мини-игру на Phaser.js 3, как мне внедрить в неё ИИ и научить его выигрывать?
Вот демка игры: https://jump.teleweb.repl.co/
Суть игры: собирать как можно больше звёзд и не наткнуться на бомбу
Код игры на гитхабе: https://github.com/teenagerbot/JumpAI

В нейронках я новенький, ОЧЕНЬ прошу - помогите

Вопрос задан более двух лет назад
123 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Веб-разработчик

12 месяцев

Далее
Яндекс Практикум

Фронтенд-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

2 комментария

mayton2019 @mayton2019

Мне казалось что те алгоритмы которые учились проходить Супер-Марио вообще не имели доступа к коду. Тоесть они только видели то что видет игрок на экране и получали подкрепление в случае более улучшенного прохождения уровне (быстрее там или с большим числом очков).

В данном случае расчет расстояния до звезды представляет собой отдельную проблему которая стоит как-бы блокером до того как нейросеть вообще начнет получать хоть какую-то информацию из состояния игры.

Написано более двух лет назад
rPman @rPman

Идеи RL не подразумевают что совсем нет никакого знания о среде. Чтобы обучить нейронную сеть нужна функция ошибки, желательно непрерывная, точнее имеющая множество значений а не пара хорошо-плохо, чтобы сеть могла эффективно принимать решение в каком направлении двигаться. Компьютерные игры обычно формально могут только по окончанию игры сказать - победа или поражение, а ИИ нужно взаимодействовать между началом и концом игры много много раз, чтобы принимать решение о следующем ходе (воздействия на среду), поэтому нужна некоторая функция, которая будет, имея представление о правилах игры и ее особенностях, давай оценку этих шагов. Один из способов - написать эту функцию или ее части самому человеку, имеющему представление об игре и какой то опыт. Дальше можно обучить нейронную систему угадывать эту оценку на основе уже сыгранных партий человеком... ну а дальше, когда ии уже сможет играть, дополнить массив этих игр новыми уже самостоятельно.

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

Простой
В цикле for много кнопок как сделать .addEventListener('click', к каждой кнопке?
- 1 подписчик
- вчера
- 164 просмотра
3

ответа
JavaScript

+2 ещё

Простой
Как получить события VK.VideoPlayer используя JS?
- 1 подписчик
- 11 нояб.
- 114 просмотров
1

ответ
JavaScript

+1 ещё

Сложный
Почему зависает виджет в OBS?
- 1 подписчик
- 10 нояб.
- 160 просмотров
0

ответов
JavaScript

Простой
Смещение группы в fabric.js?
- 1 подписчик
- 06 нояб.
- 128 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как сделать горизонтальный скролл стрелками?
- 1 подписчик
- 05 нояб.
- 213 просмотров
1

ответ
Искусственный интеллект

Простой
Как скормить весь проект нейросети (grok, chatgpt, deepseek) чтобы она понимала в нём и чтоб можно было просить ее доработать что -то?
- 1 подписчик
- 02 нояб.
- 351 просмотр
4

ответа
JavaScript

Простой
Как создать рисунок из PHP в Fabric.js?
- 2 подписчика
- 28 окт.
- 171 просмотр
1

ответ
Google

+1 ещё

Простой
Бесплатная альтернатива Gemini 2.0 Flash preview image generation?
- 3 подписчика
- 28 окт.
- 179 просмотров
2

ответа
JavaScript

+1 ещё

Простой
Какой скрипт загружает меню в Ютуб?
- 2 подписчика
- 27 окт.
- 292 просмотра
2

ответа
JavaScript

Простой
Как работать с разрозненными данными?
- 1 подписчик
- 21 окт.
- 252 просмотра
2

ответа
Показать ещё Загружается…

Fullstack Разработчик (Next.js / JavaScript / TypeScript)

App Company

от 200 000 до 300 000 ₽

Web-разработчик/WordPress программист (Full-stack)

JustBusiness • Санкт-Петербург

от 130 000 до 150 000 ₽

React разработчик

ITK academy • Нижний Новгород

от 50 000 до 90 000 ₽

Answer 1 · 2023-06-03 11:35:14

freeExec @freeExec

Участник OpenStreetMap

Для игр обычно используют подход https://en.wikipedia.org/wiki/Reinforcement_learning

Ответ написан более двух лет назад

2 комментария

Answer 2 · 2023-06-03 12:46:53

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Курс по RL.

Ответ написан более двух лет назад

2 комментария

Answer 3 · 2023-06-03 18:27:19

Если RL для тебя сложно, используй менее эффективный но очень простой подход - генетический алгоритм.
Это очень тупой и простой для реализации подход, ты реализуешь свою игру в виде метода (ты его всеравно должен бы сделать для RL), с помощью которого ты будешь тестировать своего бота:
* независящего от реального времени (т.е. внутренний таймер есть но игра проходит максимально быстро в реальном времени без пауз)
* фиксированным сидом для случайных событий (т.е. повторный запуск с теми же параметрами должен выдать тот же результат)
* пропускающего вывод графики
* на вход которого подается твой алгоритм управления (не важно чем он будет, главное чтобы он однозначно описывался какими то числами), т.е. управлением занимается метод который ты передашь в вызове
* на выход этот метод выдавал бы давал оценку, на сколько хорошо выбранный алгоритм прошел игру (0 - умер, и плюс число за звезду)
* добавляешь в этот метод лимит по внутреннему времени (т.е. чтобы - возвращало за невыполнение задания, в твоем случае это не собрал звезды)
* можно привязать оценку ко времени, например разделить собранные звезды на затраченное время (добавь какой-нибудь коэффициент влияния времени на итог).

Теперь у тебя есть метод тестер твоего алгоритма автоигры, пишешь алгоритм на основе какой-нибудь минимальной нейросети (генетический алгоритм подходит для небольшого количества искомых параметров) где на вход идет информация от игрового мира (например расстояние до ближайшей звезды, можешь добавить тут алгоритм поиска пути с учетом прыжков, и расстояние тут - движение персонажа а не корень суммы квадратов разницы расстояний), а на выходные нейроны это управляющие кнопки (кстати все кто экспериментируют с этим рекомендуют делать две нейронки, одна отвечает за потребности, другая за движения, первая подает сигналы на вторую, но это уже вкусовщина).

Инициализируешь веса своей сети случайными значениями.
Запускаешь сотню - тысячу итераций со слегка подправленными весами (мутации и скрещивание, отдельный разговор как именно) и выбираешь некоторое количество тех изменений, для которых выходы твоего метода тестирования максимальные.
Повторяешь в цикле запуск итераций до тех пор пока не надоест, или результат тестирования не станет максимально возможным (собраны звезды за какое то минимальное время).

Задача будет решена, но времени (вычислительных ресурсов) для этого может потребоваться очень много.

Если интеллект твоего робота будет из двух сетей, то та что моторная можно обучить отдельно, другими алгоритмами, так как для нее легче сделать функцию ошибки (1/расстояние до цели например), это значительно сэкономит время. Так же можно вместо управляющей нейронки написать тупой код (например управляющая принимает решение, какие звезды собрать и когда уворачиваться от бомбы, просчитывая ее положение на основе известных тебе игровых алгоритмов)

Как научить нейронку выигрывать в моей Phaser.js игре?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт