Где скачать файл «YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf»?

Question

Олег Медведев @cubinez85

Яндекс

Где скачать файл «YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf»?

Пытаюсь установить локально yandex/YandexGPT-5-Lite-8B-instruct-GGUF.
Все делаю по инструкции:

https://huggingface.co/yandex/YandexGPT-5-Lite-8B-instruct-GGUF

Сама последовательность выглядит так:

git clone https://github.com/ggml-org/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build --config Release
cd ..

На этом этапе все ок
Проблема с запуском сервера:

llama.cpp/build/bin/llama-server -m YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf -c 32768

Я нахожусь в папке llama.cpp
Ошибка при запуске сервера:

llama.cpp/build/bin/llama-server : Имя "llama.cpp/build/bin/llama-server" не распознано как имя командлета, функции, файла сценария или выполняемой
 программы. Проверьте правильность написания имени, а также наличие и правильность пути, после чего повторите попытку.
строка:1 знак:1
+ llama.cpp/build/bin/llama-server -m YandexGPT-5-Lite-8B-instruct-Q4_K ...
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : ObjectNotFound: (llama.cpp/build/bin/llama-server:String) [], CommandNotFoundException
    + FullyQualifiedErrorId : CommandNotFoundException

Изменил команду запуска сервера:

.\build\bin\Release\llama-server.exe `
 -m "YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf" `
 -c 32768 `
 -t 4

Не находит model 'YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf':

build: 6303 (5a0e3ef6) with MSVC 19.38.33145.0 for x64
system info: n_threads = 4, n_threads_batch = 4, total_threads = 8

system_info: n_threads = 4 (n_threads_batch = 4) / 8 | CPU : SSE3 = 1 | SSSE3 = 1 | AVX = 1 | AVX2 = 1 | F16C = 1 | FMA = 1 | LLAMAFILE = 1 | OPENMP = 1 | REPACK = 1 |

main: binding port with default address family
main: HTTP server is listening, hostname: 127.0.0.1, port: 8080, http threads: 7
main: loading model
srv    load_model: loading model 'YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf'
gguf_init_from_file: failed to open GGUF file 'YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf'
llama_model_load: error loading model: llama_model_loader: failed to load model from YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf
llama_model_load_from_file_impl: failed to load model
common_init_from_params: failed to load model 'YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf'
srv    load_model: failed to load model, 'YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf'
srv   operator (): operator (): cleaning up before exit...
main: exiting due to model loading error

Где можно скачать файл "YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf"?
Я думал, что он автоматом грузится из реп https://github.com/ggml-org/llama.cpp.git

Вопрос задан 29 авг.
211 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик с нуля

6 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+1 ещё

Простой
Как установить «Госплагин» в Яндекс-браузер на Debian 12?
- 1 подписчик
- 10 нояб.
- 495 просмотров
1

ответ
Яндекс

+2 ещё

Средний
Как работает аутентификация Яндекса через QR-код?
- 1 подписчик
- 28 окт.
- 193 просмотра
1

ответ
Windows

+3 ещё

Средний
Как решить проблему с доступами на устройства в Яндекс Браузере?
- 1 подписчик
- 08 окт.
- 273 просмотра
0

ответов
Яндекс

Простой
Сколько живёт ссылка в Яндекс телемост?
- 1 подписчик
- 28 сент.
- 389 просмотров
2

ответа
Электронная почта

+3 ещё

Средний
Как настроить получение SMTP command pipelining?
- 1 подписчик
- 17 сент.
- 101 просмотр
0

ответов
Яндекс

Простой
Как поделиться данными Яндекс-формы?
- 1 подписчик
- 03 сент.
- 743 просмотра
1

ответ
Яндекс

Простой
Как убрать цветную кляксу в центре страницы яндекс музыки?
- 1 подписчик
- 31 авг.
- 475 просмотров
2

ответа
Поисковая оптимизация

+3 ещё

Простой
Как убедиться, что одностраничный сайт (SPA) корректно индексируется поисковыми системами Google и Яндекс?
- 7 подписчиков
- 26 авг.
- 1637 просмотров
3

ответа
HTML

+3 ещё

Простой
Как отменить инвертирование текста в yandex почте в dark mode?
- 2 подписчика
- 19 авг.
- 233 просмотра
1

ответ
Показать ещё Загружается…

Ведущий интернет-маркетолог

Парк «Сказка» • Москва

от 250 000 до 350 000 ₽

Маркетолог (B2C направления)

Prosox

от 800 до 1 500 $

Инженер данных в Плюс Фантех

Яндекс • Москва

от 300 000 до 490 000 ₽

Answer 1 · 2025-08-29 10:53:47

Ну буквально вот по ссылке с вашей же инструкцией и скачать - https://huggingface.co/yandex/YandexGPT-5-Lite-8B-...

Там вверху кнопка files

Answer 2 · 2025-08-29 15:33:21

по ссылке, которую вы же сначала привели https://huggingface.co/yandex/YandexGPT-5-Lite-8B-... а точнее там вкладка files and versions лежит YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf там справа кнопка скачать

Где скачать файл «YandexGPT-5-Lite-8B-instruct-Q4_K_M.gguf»?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт