А пробовал готовые оркестраторы? агенты, а не просто чаты?
попробуй vscode + плагин kilocode + нейросеть сейчас бесплатная для теста grok-code-fast (или супернова вот вышла) , изучи документацию по Kilocode, настрой инструменты (что можно, что нельзя), запускай архитектора, описывай задачу (только нормально, а не просто "хочу кнопку")
работает быстро, пишет быстро, не без грешков.
на данный момент времени код-агенты пока сильно не совершенны, на уровне джунов, но думаю до миддлов дотянут через год точно.
запускать что-то нормальное локальное на твоем железе - нереально, на железе смогут запуститься только прошлогодние модели или слабые по логике. сам недавно тестил практически все кодеры на 16VRAM (24RAM)
быстро отрабатывает только gpt-oss-20b (остальные по 5 минут обдумывают каждый шаг)