Случайно нашел эту тему. У меня тут вопрос по крестикам-ноликам. Не подскажете? Как reinforcement learning сохраняет найденную оптимальную стратегию?
Не могу разобраться в каком виде компьютер сохраняет обученную стратегию на Qlearning для того, чтобы можно было пользоваться в дальнейшем?
Просто сохраняет все возможные варианты решений и из них выбирает то, у которого число Q максимально?
Например я создаю файл bat и программа находится c:\1.exe
В Batнике нужно написать? Так получается?
--------------------
c:\1.exe
notepad >> c:\temp\a.log
------------------
pfg21, в автозагрузке запускается файл Exe, который закроет командную строку в случае ошибки, а я хочу вашим способом сделать , чтобы запустилась командная строка, а потом файл.
Сергей Горностаев, Спасибо, а сможете подсказать, как теперь мой файл из командной строки запускался при запуске Windows? То есть как сделать вашим способом только при помощи автозагрузки.
Самое лучшее обучение - это делать реальный проект, которые решает какие-то проблемы. У меня как раз есть такой проект сейчас на Python, если интересно, то skype: backside7777
Не могу разобраться в каком виде компьютер сохраняет обученную стратегию на Qlearning для того, чтобы можно было пользоваться в дальнейшем?
Просто сохраняет все возможные варианты решений и из них выбирает то, у которого число Q максимально?