M

Mistral 7B Instruct V0.2 GGUF

由 Mungert 开发
Mistral-7B-Instruct-v0.2是基于Mistral-7B架构的指令微调模型,支持文本生成任务,采用IQ-DynamicGate超低比特量化技术优化内存效率。
下载量 742
发布时间 : 3/16/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个7B参数的指令微调大语言模型,支持文本生成任务,特别优化了在低内存设备上的运行效率。

模型特点

IQ-DynamicGate超低比特量化
采用1-2比特精度自适应量化技术,在保持内存效率的同时提升模型准确性。
动态精度分配
前25%和后25%层使用IQ4_XS,中间50%层使用IQ2_XXS/IQ3_S,关键组件保护使用Q5_K。
多格式支持
提供BF16、F16及多种量化格式(Q4_K、Q6_K、Q8_0等),适配不同硬件需求。

模型能力

文本生成
指令跟随
低内存推理

使用案例

内存受限部署
边缘设备文本生成
在内存有限的边缘设备上运行文本生成任务。
IQ1_M困惑度降低43.9%,内存占用仅增加0.3GB
研究应用
超低比特量化研究
研究1-2比特量化对模型性能的影响。
IQ2_S困惑度降低36.9%