Изучаю Reinforcement leaning, хотелось бы разобрать и модифицировать простой пример наподобии крестиков-ноликов для того, чтобы лучше понять материал.
Пока нашел вот такое:
https://github.com/pybrain/pybrain/tree/master/examples
И вот
https://rlpy.readthedocs.io/en/latest/
Но тут похоже надо долго копаться, чтобы заработало, может есть что-то совсем простое?
Заранее спасибо