Лучшая на текущий момент по соотношение качество/цена в задачах программирования это
Anthropic Claude Sonnet 4.7, в частности у них заявлен Computer Use for coding, приложение, в котором вы отдаете компьютер под управление модели (подключаемой по api) и командуете ей, и она выполняет команды, смотрет вывод, решает проблемы и т.п.
Сам не пробовал, так как я использую их ИИ давно, в т.ч. для различных задач программирования, я знаю что есть ситуации где оно будет ошибаться, и ошибки будут неприятными, такие ошибки в режиме управления могут стать если не фатальными то выйти в копеечку.
Но есть идеи, как прикрутить это к виртуалке со снапшотами (каталог с кешем пакетов можно вынести на сетевой диск) и попробовать в промпте дать ему возможность откатывать состояние машины назад... в общем есть где разгуляться.
p.s. такие эксперименты будут не дешевы.