Forge использует какие то конвертации весов во другой формат, для лучшей совместимости с разными LOR-а. Для квантованных моделей этот процесс еще дольше. Скажу больше, так же forge любит делать конвертации прямо перед просчетом, иногда по минуте на мощной машине (r7950/3090)
Для прямой загрузки модели, без конвертации, лучше использовать ComfyUI/GGUF Loader ноду.
Вот готовая
схема для Comfy, распаковать, перетащить на канвас.