Задать вопрос
weranda
@weranda

Какая AI модель дешевле в пересчете на решение задачи в программировании?

Тестирую тут разные модельки для решения разных задач по программированию. В разное время у моделей разное поведение. Одни многословнее, другие решают задачу за раз, в других приходится задавать доп. запросы и т. п. В итоге недорогая по стоимости за токены модель может «сожрать» бюджет немногим отличающийся от дорогой за токены модели, но решающей задачу буквально за раз, почти.

В связи с этим встал вопрос о том, может ли оказаться более дорогая модель по результатам работы определенного периода и/или решения одного и того же круга задач дешевле или сопоставимой по цене с более дешевой? Или более дешевая, наоборот, немного отличающейся по бюджету в сравнении с более дорогой? Попробовал поискать информацию в сети по этому вопросу, но не нашел.

Если вы работаете или работали с разными моделями, то есть ли у вас наблюдения на этот счет?
  • Вопрос задан
  • 242 просмотра
Подписаться 1 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 3
@SWA512
Gamedev
Отказался от платных моделей, сейчас мой топ такой, в порядке работоспособности и качества кода: (все бесплатные без API)
- MS Copilot (GPT5)
- Google Gemini 2.5Pro
- QWEN Max Preview
- DeepSeek
- Grok 4
- KIMI K2

Локальные:
- Seed OSS 36B *
- Qwen3 Coder 30B
- Gemma 3 27B

* (очень долго рассуждает, 200строк класс C# = 20мин на 3090, но очень код неплох и много полезного можно почерпнуть из размышлений)
Ответ написан
vpetrov
@vpetrov
частный SEO-специалист
Если брать ценник, то тут, кмк, локально размещенная бесплатная модель + RAG решает.
Из минусов: "железо" и время. Тут всё таки для серьёзной модели и железо соответствующее нужно.
Ответ написан
TrueBers
@TrueBers
Гуглю за еду
Попробовал поискать информацию в сети по этому вопросу, но не нашел.
Зачем обманывать? Не искал же. Когда каждую неделю публикуют по несколько десятков бенчмарков, и ты не нашёл? Это как вообще?

С таким упорством тебе любая модель подойдёт, какая разница, если даже бенчмарк найти для тебя проблема...
https://www.swebench.com хотя бы для кого придумали? О нём по-моему из каждого утюга говорят, кто хотя бы краем уха интересуется LLM.
На https://www.vals.ai куча бенчмарков.
https://artificialanalysis.ai
Столько бенчмарков каждый день выходит, что времени не хватит всё разбирать.

Если вы работаете или работали с разными моделями
Любой адекватный разработчик, который продуктивно использует нейронки сейчас просто обязан пользоваться практически всеми существующими моделями и уметь их применять, знать различия. Кто пользуется одной моделью -- застрял где-то в болоте.

Сейчас нейросети это не "какая модель топовая", а какая модель топовая сегодня. Всё меняется каждый день с колоссальной скоростью, нужно следить за бенчами в реальном времени, тогда будет какой-то толк.

И вообще вопрос некорректный, на который нельзя ответить без поставленной задачи. Для каких тебе задач нужна модель? Что она должна делать? На каких языках кодить? Должна уметь в фундаментальные алгоритмы или просто на джаваскрипте формочки двигать? Какие фичи? Агентская? Должна уметь вызывать тулинг, MCP? Или просто считать бакс на фикс в тупую? Нужна скорость? Нужна точность? Итеративность или one-shot? Насколько большое контекстное окно ожидается?

Если всё так же лень искать, поищу за тебя абстрактный бенчмарк в вакууме под рандомную задачу:
На текущий день самым оптимальным по бенчмаркам идёт Grok 4 Fast. Он в топе по соотношению цена/качество/скорость. Но ситуация поменяется уже через неделю, зачем тебе эта информация, если ты не будешь искать новый бенчмарк через неделю, непонятно.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы