Какие методы машинного обучения можно использовать для обучения системы управления по фитнес-функции, кроме генетического алгоритма?
Задача:
Машина едет по трассе, собирая бонусы по дороге. На входе имеем данные, карта местности в пределах области видимости, текущая скорость, текущее положение, на выходе системы управления команды: когда и как повернуть, когда ускориться, когда затормозить и т.п. Фитнес-функция оценивает оптимальность пройденного пути.
Какие методы машинного можно использовать для решения данной задачи, кроме генетических алгоритмов для нейронной сети?
Q-алгоритм
И успешное применение нейронных сетей для аппроксимации таблицы Q(S, a), реализованное Deep Mind в виде DQN https://arxiv.org/abs/1312.5602
После этого было еще много разных статей, которые решали всякие проблемные моменты вроде действий с параметрами. Последнее, что я видел на эту тему - это архитектура A3C https://arxiv.org/pdf/1602.01783.pdf
В инете можно найти посты с реализациями на разных языках и библиотеках.