Вопрос ещё и в том, надо ли писать такое под микроконтроллеры (изобретая по пути велосипеды) - или проще под подобную функциональность поставить на борт, например, какой-либо arm с линухом и tensorflow (например) на борту. А микроконтроллерам оставить всякий реалтайм, например.
"самообучающийся робот"
One-shot reinforcement learning, или у нас безлимитные боты? :-)