проблема и в том что генерация отнимает времяэту задачу потянет самая минимальная модель при правильной настройке, там не нужен ни thinking, ничего такого. SO даст 80% успеха, агент-валидатор поверх ещё 15-17% сверху.
const QColor color = (progress != 100) ? QColorConstants::Blue : QColorConstants::Green;
Я понял что в IT и тем более в junior разработчиках делать нефиг!Джуниоры никогда не были нужны, даже на заре моей карьеры 20 лет назад. А уж сейчас, когда хорошо настроенный пайплайн ИИ агентов за 200 баксов в месяц уверенно подбирается к сеньорскому уровню, не нужны ни мидлы, ни джуны. Всё уходит в крайности: ты либо вайбкодер, который вообще нихера не понимает, а просто тыкает и ждёт пока агент ему что-то похожее на его задачу соберёт, либо нужны upper-senior, которые очень хорошо понимают, как это всё работает и как этим пользоваться, и сами в случае чего могут написать своего агента под себя, знают как тюнить промпты, создавать эффективные скиллы для агентов.
За тот объём знаний который требуют платят 50т.р.Ну, и рабство в мире так то распространено до сих пор, у людей есть спрос на унижения, созданный какими-то психологическими травмами. Так что, согласные на такое будут всегда. Но вопрос: зачем туда идти, когда есть и те, кто платят? Хороший, уверенный в своих силах, инженер может с небольшим трудом себе $100к в год найти удалёнку и бед не знать. Но для этого нужно что-то делать, увы. Не дай бог, ещё из дома выйти или английский выучить! Страшно то блин как!
Но вы ответственность то несёте за код?Ну, здесь есть 2 варианта:
Кто вам это сказал?Почитайте хотя бы про Cerebras.ai и их блины для инференса, которые от 20 до 50 раз быстрее, чем GPU. OpenAI уже начал внедрять их в некоторых инстансах. Если пользуетесь ChatGPT, могли заметить, что иногда в Thinking режиме моментально проходит несколько CoT-итераций, это значит, ваш запрос попал на железку от Серебрасов.
инвесторы захотят с лихвой отбить влитые туда тонны денег!Вы видели цены на размещение рекламы в ChatGPT сейчас? По информации инсайдеров, они примерно равны ценам за рекламу на крупнейших мероприятиях мира, типа спортивных чемпионатов. Нет у них проблем с отбитием бабла.
Новые модели требуют всё больше железаОчень странная у вас информация.
вообще вы злой какой-то)))вряд ли, это просто недоумение от того, что человеку нужен молоток чтобы забивать гвозди, он удобен, специально придуман для этой цели как самый эффективный и простой в освоении инструмент, но мне говорят, что забивают гвозди телефоном. Я спрашиваю, почему, ведь есть для этого специальный инструмент, научись с ним работать и будет быстрее, удобнее, и телефон не разобьёшь. Но мне отвечают, что телефоном удобнее, он всегда по рукой, я уже привык им забивать гвозди, не хочу изучать молоток.
Чтобы каждый раз не описывать в новом чате методологиючтобы каждый раз её не описывать, придумали system prompt'ы, AGENTS.md, SKILLS.md, и прочие стандартизованные вещи вместо костылей. Раз нужен костыль, так бы и сказал, что пользоваться готовым, давно придуманным до тебя, не интересно.
Если делать свой локальный инференс, только на железо, электричество, охлаждение и прочие расходы в среднем по больнице на текущий момент порядка $1-1.5k в месяц на одного разработчика с экстраполяцией в районе 3 лет, чтобы комфортно кодить без тупняков и ожиданий.
GPU-сервер с 8×H100 порядка $400к, электричества в районе $1к в месяц. На таком сервере ~8–10 одновременных активных нелагающих отзывчивых сессий будет на топовой модели.
Плюс, чтобы была "локальная версия агента столь же эффективна", нужны специалисты, которые вам этого "эффективного" агента напишут. Как я уже упомянул, таких почти нет сейчас в РФ. И ценники у них от $10-15к в месяц минимум.
Ещё нужно учитывать, что в облачных harness недоработки агента сглаживаются дополнительным ризонингом модели, когда что-то недоделано, закосячено, модель сама добавит токенов на ризонинг и постарается исправить недочёт. Когда же агент самописный и его разработчики не сильно могут отличить понятия "embedding vector" от "std::vector", "feedback loop" от "for loop", и просто запихивают данные через API в модель, то все косяки будут видны в виде галлюцинаций. И придётся понимать, как с этим бороться. А это колоссальной сложности задачи, простые локальные кодеры конторы с ней вряд ли справятся. Поэтому нужен будет как минимум один хороший спец, который разбирается в этом, но за конский ценник.
В итоге, получается порядок экстраполирования от $17к до $2к на 1 разраба, который в кайф будет кодить как с облачным инференсом. Если компания может такое потянуть, то можно начинать взвешивать "за" и "против". Если нет, то будут либо страдания, либо по-тихому данные всё равно будут утекать.