Задать вопрос
@Strangelylookingperson

По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Насколько этот разрыв позволяет конкурировать Яндексу с другими компаниями хотя бы на российском рынке, особенно когда с него снимут ограничения, и когда у Яндекса будет хотя бы 100 миллиардов параметров?

Я понимаю, не одними параметрами, но это важная характеристика, которую нельзя сбрасывать со счетов.
  • Вопрос задан
  • 658 просмотров
Подписаться 1 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 2
Maksim_64
@Maksim_64
ML Engineer
Окей я не слежу за LLM от яндекса. https://github.com/yandex/YaLM-100B этому 2 года и там 100B или здесь
https://huggingface.co/yandex тоже самое. YALM-4 вообще не слышал, и уж точно не поверю, что яндекс использует сегодня модель с 1.4B параметров.
Ответ написан
@stastp
Разрыв в количестве параметров между YALM-4 и GPT-3 действительно значительный. Параметры нейросетей — это важный, но не единственный фактор, определяющий их эффективность. Более крупные модели, как правило, имеют лучшие способности к обобщению и могут справляться с более сложными задачами, но качество работы модели также зависит от качества данных, на которых она обучалась, архитектуры модели и алгоритмов обучения.
Как вы отметили, параметры — это не единственный показатель. Важны также факторы, такие как доступ к данным, инфраструктура для обучения и развертывания моделей, а также способность адаптироваться к потребностям пользователей.
В целом, хотя разрыв в количестве параметров значителен, он не является единственным определяющим фактором. С правильной стратегией и фокусом на локальные потребности Яндекс вполне способен конкурировать на российском рынке.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
DigitalHR Москва
от 130 000 до 180 000 ₽
DigitalHR Москва
от 100 000 до 150 000 ₽
Diamond Personnel R&C Москва
До 110 000 ₽