@leader39

Какие методы машинного обучения можно использовать для обучения системы управления по фитнес-функции, кроме генетического алгоритма?

Задача:
Машина едет по трассе, собирая бонусы по дороге. На входе имеем данные, карта местности в пределах области видимости, текущая скорость, текущее положение, на выходе системы управления команды: когда и как повернуть, когда ускориться, когда затормозить и т.п. Фитнес-функция оценивает оптимальность пройденного пути.
Какие методы машинного можно использовать для решения данной задачи, кроме генетических алгоритмов для нейронной сети?
  • Вопрос задан
  • 146 просмотров
Решения вопроса 1
@ivodopyanov
NLP, python, numpy, tensorflow
Q-алгоритм
И успешное применение нейронных сетей для аппроксимации таблицы Q(S, a), реализованное Deep Mind в виде DQN https://arxiv.org/abs/1312.5602
После этого было еще много разных статей, которые решали всякие проблемные моменты вроде действий с параметрами. Последнее, что я видел на эту тему - это архитектура A3C https://arxiv.org/pdf/1602.01783.pdf
В инете можно найти посты с реализациями на разных языках и библиотеках.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
Arseny_Info
@Arseny_Info
R&D engineer
Похоже на задачу для reinforcement learning. Почитайте, например, karpathy.github.io/2016/05/31/rl
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы