LLM. Qwen2.5-Coder-32b-IQ2_XS vs Qwen2.5-Coder-14b-Q4_K_M. Что лучше?
Здравствуйте.
Никак не могу определиться какая модель лучше по качеству.
Qwen2.5-Coder-32b с очень сильным квантованием IQ2_XS.
Или модель поменьше Qwen2.5-Coder-14b но с квантованием послабее Q4_K_M.
По потреблению ресурсов и скорости одинаковые.
По качеству за пару часов тестирования так и не смог понять что лучше.
Может есть какие нибудь обзоры/исследования или по личному опыту кто нибудь тут знает?