По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Question

Strangelylookingperson @Strangelylookingperson

По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Насколько этот разрыв позволяет конкурировать Яндексу с другими компаниями хотя бы на российском рынке, особенно когда с него снимут ограничения, и когда у Яндекса будет хотя бы 100 миллиардов параметров?

Я понимаю, не одними параметрами, но это важная характеристика, которую нельзя сбрасывать со счетов.

Вопрос задан 12 нояб. 2024
647 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

5 комментариев

Strangelylookingperson @Strangelylookingperson Автор вопроса

Спасибо большое за ответ

Написано 12 нояб. 2024
Mors Clamor @66demon666

stastop, пора уже вводить в причину удаления вопроса "легко решается нейросетью" и ответа "сгенерировано ИИ"

Написано 12 нояб. 2024
stastp @stastp

Mors Clamor, соглашусь, за мной тоже такой грех есть...

Написано 12 нояб. 2024
iron-zorin @iron-zorin

Кто отвечал?

Написано 06 дек. 2024
stastp @stastp

iron-zorin, Можно и угадать, тотже YaGPT

Написано 06 дек. 2024

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- вчера
- 36 просмотров
0

ответов
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- вчера
- 56 просмотров
0

ответов
Поисковая оптимизация

+3 ещё

Средний
Yandex не индексирует изображения на сайте, почему?
- 2 подписчика
- 01 июл.
- 686 просмотров
2

ответа
HTML

+1 ещё

Простой
Как выложить игру в Яндекс игры?
- 1 подписчик
- 30 июн.
- 175 просмотров
1

ответ
Яндекс

+1 ещё

Простой
Возможно ли войти в корпоративный канал Teams с корпоративной почты yandex 360?
- 1 подписчик
- 17 июн.
- 59 просмотров
0

ответов
Android

+2 ещё

Средний
Как отвязать устройство от ChatGPT?
- 2 подписчика
- 07 июн.
- 536 просмотров
2

ответа
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 177 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 274 просмотра
1

ответ
Python

+1 ещё

Средний
Как разработать нейросеть для антиспуфинга (Face-antispoofing)?
- 1 подписчик
- 24 мая
- 169 просмотров
0

ответов
Нейронные сети

Простой
В какой нейросети можно делать видеофильмы?
- 1 подписчик
- 22 мая
- 190 просмотров
2

ответа
Показать ещё Загружается…

Интернет-маркетолог

Stream Telecom • Санкт-Петербург

от 90 000 до 120 000 ₽

SEO-specialist

Diamond Personnel R&C • Москва

До 110 000 ₽

Fullstack разработчик JavaScript, php

Дорстрой-36 • Воронеж

от 100 000 до 150 000 ₽

Answer 1 · 2024-11-12 11:49:45

Окей я не слежу за LLM от яндекса. https://github.com/yandex/YaLM-100B этому 2 года и там 100B или здесь
https://huggingface.co/yandex тоже самое. YALM-4 вообще не слышал, и уж точно не поверю, что яндекс использует сегодня модель с 1.4B параметров.

Answer 2 · 2024-11-12 11:33:44

Разрыв в количестве параметров между YALM-4 и GPT-3 действительно значительный. Параметры нейросетей — это важный, но не единственный фактор, определяющий их эффективность. Более крупные модели, как правило, имеют лучшие способности к обобщению и могут справляться с более сложными задачами, но качество работы модели также зависит от качества данных, на которых она обучалась, архитектуры модели и алгоритмов обучения.
Как вы отметили, параметры — это не единственный показатель. Важны также факторы, такие как доступ к данным, инфраструктура для обучения и развертывания моделей, а также способность адаптироваться к потребностям пользователей.
В целом, хотя разрыв в количестве параметров значителен, он не является единственным определяющим фактором. С правильной стратегией и фокусом на локальные потребности Яндекс вполне способен конкурировать на российском рынке.

По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт