По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Question

Strangelylookingperson @Strangelylookingperson

По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Насколько этот разрыв позволяет конкурировать Яндексу с другими компаниями хотя бы на российском рынке, особенно когда с него снимут ограничения, и когда у Яндекса будет хотя бы 100 миллиардов параметров?

Я понимаю, не одними параметрами, но это важная характеристика, которую нельзя сбрасывать со счетов.

Вопрос задан более года назад
660 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Инженер по тестированию

10 месяцев

Далее
Нетология

Инженер по тестированию

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

5 комментариев

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Мобильные устройства

+1 ещё

Простой
Какой девайс взять, чтоб за границей говорить и слушать иностранцев?
- 3 подписчика
- 13 часов назад
- 255 просмотров
4

ответа
Электронная почта

+2 ещё

Простой
Зашифрованы ли письма сквозным шифрованием у Gmail и Yandex?
- 2 подписчика
- 23 нояб.
- 1205 просмотров
2

ответа
Linux

+1 ещё

Простой
Как установить «Госплагин» в Яндекс-браузер на Debian 12?
- 1 подписчик
- 10 нояб.
- 743 просмотра
1

ответ
Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб.
- 323 просмотра
1

ответ
Яндекс

+2 ещё

Средний
Как работает аутентификация Яндекса через QR-код?
- 1 подписчик
- 28 окт.
- 242 просмотра
1

ответ
Нейронные сети

Простой
Как работать с планами в CursorAi?
- 2 подписчика
- 26 окт.
- 133 просмотра
1

ответ
Нейронные сети

Простой
Как надиктовывать текст голосом в Cursor?
- 1 подписчик
- 24 окт.
- 107 просмотров
1

ответ
Нейронные сети

Средний
Имеют ли нейросети или надстройки над ними возможность анализа «полноты» вопроса?
- 1 подписчик
- 23 окт.
- 97 просмотров
2

ответа
Нейронные сети

Сложный
Как организовать разбивку по таймкодам текста из 30000 слов?
- 1 подписчик
- 18 окт.
- 78 просмотров
0

ответов
Windows

+3 ещё

Средний
Как решить проблему с доступами на устройства в Яндекс Браузере?
- 1 подписчик
- 08 окт.
- 293 просмотра
0

ответов
Показать ещё Загружается…

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик бэкенда в команду коммуникационной платформы

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Answer 1 · 2024-11-12 11:49:45

Окей я не слежу за LLM от яндекса. https://github.com/yandex/YaLM-100B этому 2 года и там 100B или здесь
https://huggingface.co/yandex тоже самое. YALM-4 вообще не слышал, и уж точно не поверю, что яндекс использует сегодня модель с 1.4B параметров.

Answer 2 · 2024-11-12 11:33:44

Разрыв в количестве параметров между YALM-4 и GPT-3 действительно значительный. Параметры нейросетей — это важный, но не единственный фактор, определяющий их эффективность. Более крупные модели, как правило, имеют лучшие способности к обобщению и могут справляться с более сложными задачами, но качество работы модели также зависит от качества данных, на которых она обучалась, архитектуры модели и алгоритмов обучения.
Как вы отметили, параметры — это не единственный показатель. Важны также факторы, такие как доступ к данным, инфраструктура для обучения и развертывания моделей, а также способность адаптироваться к потребностям пользователей.
В целом, хотя разрыв в количестве параметров значителен, он не является единственным определяющим фактором. С правильной стратегией и фокусом на локальные потребности Яндекс вполне способен конкурировать на российском рынке.

По неподтверждённой информации, в нейросети Яндекса YALM-4 около 1.4 миллиардов параметров. В GPT-3 — 130 миллиардов. Насколько этот разрыв радикален?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт