Обучение с учителем - это понятно. С помощью Keras создаём модель НС, задаём два массива с входными данными и правильными ответами. Дальше нам нужно только нажать кнопку запуска и ждать результат. Т.е. мы задаём параметры и весь процесс идёт автоматически.
В моём случае, есть поток входящих данных, правильный ответ рассчитывает функция в зависимости от входящих данных и времени. Я так понимаю, тут как раз нужно обучение с подкреплением. Т.е. нужен "модуль" обучения сети, который будет сравнивать ответ НС и правильный (вычисленный функцией), и корректировать веса. И продолжать цикл обучения дальше. Т.е. нужно как-то ручками написать часть отвечающую за сам процесс обучения, которая в обучении с учителем выполняется "автоматически".
Есть какие-то стандартные решения для этого в Keras? Или как ещё это можно решить?
Если есть какие-то ссылки на подобную тему на русском языке, буду очень рад их увидеть.