Задать вопрос

ExeLover @ExeLover

нейронные-сети

Какие есть способы сделать динамическое квантование LLM в GGUF?

Доброго времени суток. Возможно ли как-то преобразовать ллм в gguf, при этом с возможностью изменить вес каждого тензора конкретно для него?
Недавно прочитал статью с хабра о супер-весах, изменение размерности которых ведет за собой значительное ухудшение качества модели. Так же после выхода модели deepseek с квантованием в 1.28 (вроде) бита от unsloth мной было решено найти способ создавать свои модели такого вида.
В llama.cpp, насколько я помню, либо полностью нет такого функционала, либо есть, но он очень урезан. Было бы интересно попробовать вручную указать метод квантования для каждого слоя.

Вопрос задан 29 янв.
122 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+1 ещё

Средний
Как улучшить семантический поиск и стаблилизировать Recall?
- 1 подписчик
- 7 часов назад
- 17 просмотров
0

ответов
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- вчера
- 102 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 62 просмотра
1

ответ
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 126 просмотров
3

ответа
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 52 просмотра
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 64 просмотра
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 187 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 287 просмотров
1

ответ
Python

+1 ещё

Средний
Как разработать нейросеть для антиспуфинга (Face-antispoofing)?
- 1 подписчик
- 24 мая
- 171 просмотр
0

ответов
Нейронные сети

Простой
В какой нейросети можно делать видеофильмы?
- 1 подписчик
- 22 мая
- 194 просмотра
2

ответа
Показать ещё Загружается…

YADRO

ML-инженер (MLOps)

Банк России • Санкт-Петербург

Deep Learning Engineer в команду Perception

Navio • Москва