Какие есть нейронные сети которые можно обучить на исходном коде?

Question

Владимир @cinme

Программист С++

Какие есть нейронные сети которые можно обучить на исходном коде?

Ищу нейронную сеть, которой можно скормить исходники движка Unreal Engine и задавать вопросы по разным частям кода. Конеретно сейчас изучаю MASS AI. Очень много вопросов возникает, на форуме и в чатах считанные единицы сталкивались с предметом и то ответа не дают.
Требуется нейронная сеть, которая может работать автономно, без доступа к сети. Важна большая точность, пусть даже с невысокой производительностью.
В какую сторону следует копать?

Вопрос задан более двух лет назад
1713 просмотров

Комментировать

Подписаться 7 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

ИИ в медицине: как использовать в работе каждый день

8 недель

Далее
Академия Эдюсон

Нейросети в строительстве

2 месяца

Далее
Бруноям

ИИ-агенты и n8n

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

5 комментариев

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 15 часов назад
- 44 просмотра
1

ответ
MacBook

+2 ещё

Простой
Mac для машинного обучения, стоит ли брать?
- 1 подписчик
- 20 часов назад
- 135 просмотров
2

ответа
Веб-разработка

+2 ещё

Средний
Как создавать нормальный B2B SaaS? Есть ли какие то ру курсы/литература? Насколько углубленные знания языка программирования должны быть?
- 1 подписчик
- 16 июл.
- 151 просмотр
6

ответов
Нейронные сети

Простой
Как решить проблему с генерацией видео в Kling AI?
- 1 подписчик
- 09 июл.
- 78 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 149 просмотров
2

ответа
Боты

+1 ещё

Простой
Как создать бота ВК на иностранных мозгах?
- 1 подписчик
- 30 июн.
- 262 просмотра
2

ответа
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 423 просмотра
3

ответа
ChatGPT

Простой
Perplexity — это нейросеть или поисковый сервис с ИИ? Чем она отличается от ChatGPT?
- 2 подписчика
- 29 июн.
- 451 просмотр
3

ответа
Машинное обучение

+1 ещё

Средний
Как устроены Нейрохам и подобные ему боты с точки зрения ML?
- 1 подписчик
- 24 июн.
- 503 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 306 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2024-05-13 20:19:49

Ни одна gpt не сможет полноценно решать такую задачу

скормить исходники движка Unreal Engine

потому что это НОВАЯ информация, ее не получится добавить в виде обучающей выборки и finetune. Так как это заставит модель больше галлюцинировать.

В теории это возможно

но потребуется переобучение (пусть и с использованием уже pretrained модели на старте) на данных, на которых эту сеть обучали! это наиважнейшее условие, с некоторой эффективностью можно проредить исходные данные, буквально на днях читал об исследованиях, как можно оценить, какие данные можно использовать для дообучения а какие нет.

Стоимость этого будет сравнима со стоимостью полного обучения - миллионы баксов, без преувеличения!

После этого потребуется еще доводка с помощью алгоритмов RLHF (нужны серии специально подобранных вопросов, так же это очень связано с тем какая была обучающая выборка, иначе модель будет низкого уровня и способна только для задач completion и очень слабо для chat, а тебе нужны instruction

GPT умеет легко обучаться только на данных, которые влезают в контекстное окно. У лучшей открытой сетки llama3-70b это 8к токенов (обычно это +-1 файл исходников) да и у других от силы 16к и 32к но они слабые и способности запоминать данные во всем окне очень слабые.
Если что, советую mixtral 8x22b, требует 85гб для 4бит квантизации (в этом случае незначительно теряется качество) или лучше 96гб для 5битной. 64к размер контекста, работает несколько токенов в секунду на процессоре, т.е. будешь ждать но не критично долго

Но это не значит что совсем нельзя. Привожу пример сессии моей беседы с бесплатным anthropic claude (у них большое окно контекста, влезает несколько исходных файлов), скармливал исходники приложения на c# для поиска дубликатов видео.

Подготовил вопросы, они должны быть в старте промпта (тогда сетка их будет использовать на протяжении всей беседы) и подготовил промпты типа:
- вот список файлов проекта, с каакого файла нужно начать анализ чтобы ответить на эти вопросы
Смотрим что скажет сетка, и подсовываем ей по одному исходному файлу который она попросит
- проанализируй этот файл, если тебе нужна информация по классам, определенным в другом месте, сообщи об этом

Дополнительно в процессе беседы дублирую информацию из основных вопросов, либо задаю наводящие вопросы, если ответ получил не полный

Сеть поняла написанный код, как он работает и смогла ответить на нетривиальные вопросы.

К промптам в конец советую добавлять что то типа, 'проанализируй шаг за шагом', и эмоциональные 'мне очень важно получить ответ на этот вопрос, иначе меня уволят' и т.п.

Будь креативным в промптах, чем лучше запрос тем больше шансов получить ответ.

Для новых вопросов начинай новую сессию, заново заливая файлы. Чем больше файлов в контексте тем хуже сеть их понимает.

p.s. 'точно и без ошибок' не будет!

Answer 2 · 2024-05-13 16:48:42

Gemini. Она умеет читать ресурсы в интернете и давать пояснения по прочитанному, в отличие от той же гпт.

PS: Из локально устанавливаемых думаю что ни одна не справится, так как контекст задачи слишком узкий, и обучение на коде ничего не даст.

Какие есть нейронные сети которые можно обучить на исходном коде?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт