Какие есть нейронные сети которые можно обучить на исходном коде?

Question

Владимир @cinme

Программист С++

Какие есть нейронные сети которые можно обучить на исходном коде?

Ищу нейронную сеть, которой можно скормить исходники движка Unreal Engine и задавать вопросы по разным частям кода. Конеретно сейчас изучаю MASS AI. Очень много вопросов возникает, на форуме и в чатах считанные единицы сталкивались с предметом и то ответа не дают.
Требуется нейронная сеть, которая может работать автономно, без доступа к сети. Важна большая точность, пусть даже с невысокой производительностью.
В какую сторону следует копать?

Вопрос задан более года назад
1551 просмотр

Комментировать

Подписаться 7 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Специалист по Data Science плюс

17 месяцев

Далее
Нетология

Бизнес-аналитик

7 месяцев

Далее
Нетология

Data Scientist: расширенный курс

13 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

5 комментариев

d'Ivan @2ord

А как это относится к вопросу? С каких источников взято?

Написано более года назад
ThunderCat @ThunderCat

Everything_is_not_so_bad, Ничего не мешает проверить лично, если вам не лень писать бессмысленный комент, то и проверить можете не полениться.

Написано более года назад
d'Ivan @2ord

ThunderCat, так сложно дать линк, а не препираться?
https://cloud.google.com/products/gemini/code-assi...
Речь об этом или другом?

Написано более года назад
ThunderCat @ThunderCat

https://gemini.google.com/app (первая строчка в поиске "gemini нейронная сеть")

Написано более года назад
d'Ivan @2ord

ThunderCat, вопрос был не столько Gemini в способности работать с кодом вообще, а относительно контекста конкретного проекта. Чтобы ИИ был способен давать советы по месту, а не только общие советы.

Написано более года назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- вчера
- 76 просмотров
0

ответов
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 72 просмотра
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 73 просмотра
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 64 просмотра
0

ответов
Железо

+3 ещё

Простой
Какие есть готовые умные очки, которые можно прошить?
- 2 подписчика
- 15 окт.
- 290 просмотров
1

ответ
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 639 просмотров
2

ответа
VPN

+2 ещё

Средний
Почему ChatGPT не пускает с прокси?
- 1 подписчик
- 05 окт.
- 891 просмотр
2

ответа
Видеокарты

+1 ещё

Простой
Выбрать ли RTX 3060 12 Гб или RTX 5060 8 Гб для бюджетного AI?
- 1 подписчик
- 01 окт.
- 453 просмотра
4

ответа
Нейронные сети

+1 ещё

Средний
Можно ли расширить словарь VOSK простой правкой каких-то текстовых файлов?
- 1 подписчик
- 30 сент.
- 96 просмотров
1

ответ
Искусственный интеллект

Сложный
Stable Diffusion генерит, а по итогу картинки нет, не показывает?
- 1 подписчик
- 29 сент.
- 98 просмотров
1

ответ
Показать ещё Загружается…

DevOps-инженер

DevTeam.Space

от 1 000 до 2 500 $

Senior/Lead PHP Developer

Boomerangme 🎫

от 4 000 до 7 000 $

Системный аналитик

ДАЛЕЕ • Москва

от 200 000 ₽

Answer 1 · 2024-05-13 20:19:49

Ни одна gpt не сможет полноценно решать такую задачу

скормить исходники движка Unreal Engine

потому что это НОВАЯ информация, ее не получится добавить в виде обучающей выборки и finetune. Так как это заставит модель больше галлюцинировать.

В теории это возможно

но потребуется переобучение (пусть и с использованием уже pretrained модели на старте) на данных, на которых эту сеть обучали! это наиважнейшее условие, с некоторой эффективностью можно проредить исходные данные, буквально на днях читал об исследованиях, как можно оценить, какие данные можно использовать для дообучения а какие нет.

Стоимость этого будет сравнима со стоимостью полного обучения - миллионы баксов, без преувеличения!

После этого потребуется еще доводка с помощью алгоритмов RLHF (нужны серии специально подобранных вопросов, так же это очень связано с тем какая была обучающая выборка, иначе модель будет низкого уровня и способна только для задач completion и очень слабо для chat, а тебе нужны instruction

GPT умеет легко обучаться только на данных, которые влезают в контекстное окно. У лучшей открытой сетки llama3-70b это 8к токенов (обычно это +-1 файл исходников) да и у других от силы 16к и 32к но они слабые и способности запоминать данные во всем окне очень слабые.
Если что, советую mixtral 8x22b, требует 85гб для 4бит квантизации (в этом случае незначительно теряется качество) или лучше 96гб для 5битной. 64к размер контекста, работает несколько токенов в секунду на процессоре, т.е. будешь ждать но не критично долго

Но это не значит что совсем нельзя. Привожу пример сессии моей беседы с бесплатным anthropic claude (у них большое окно контекста, влезает несколько исходных файлов), скармливал исходники приложения на c# для поиска дубликатов видео.

Подготовил вопросы, они должны быть в старте промпта (тогда сетка их будет использовать на протяжении всей беседы) и подготовил промпты типа:
- вот список файлов проекта, с каакого файла нужно начать анализ чтобы ответить на эти вопросы
Смотрим что скажет сетка, и подсовываем ей по одному исходному файлу который она попросит
- проанализируй этот файл, если тебе нужна информация по классам, определенным в другом месте, сообщи об этом

Дополнительно в процессе беседы дублирую информацию из основных вопросов, либо задаю наводящие вопросы, если ответ получил не полный

Сеть поняла написанный код, как он работает и смогла ответить на нетривиальные вопросы.

К промптам в конец советую добавлять что то типа, 'проанализируй шаг за шагом', и эмоциональные 'мне очень важно получить ответ на этот вопрос, иначе меня уволят' и т.п.

Будь креативным в промптах, чем лучше запрос тем больше шансов получить ответ.

Для новых вопросов начинай новую сессию, заново заливая файлы. Чем больше файлов в контексте тем хуже сеть их понимает.

p.s. 'точно и без ошибок' не будет!

Answer 2 · 2024-05-13 16:48:42

Gemini. Она умеет читать ресурсы в интернете и давать пояснения по прочитанному, в отличие от той же гпт.

PS: Из локально устанавливаемых думаю что ни одна не справится, так как контекст задачи слишком узкий, и обучение на коде ничего не даст.

Какие есть нейронные сети которые можно обучить на исходном коде?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт