Mistral-7B-Instruct-v0.3-GPTQ-4bit开源模型 - 优化推理高效完成各种任务

Mistral 7B Instruct V0.3 GPTQ 4bit

由 RedHatAI 开发

Mistral-7B-Instruct-v0.3的4位量化版本，通过GPTQ方法优化推理性能，保持高精度

下载量 9,897

发布时间 : 5/23/2024

模型简介

该模型是Mistral-7B-Instruct-v0.3的4位权重量化版本，专为高效自然语言处理任务设计，在保持99.75%原始模型精度的同时提升推理速度

高效4位量化

通过GPTQ方法将模型权重压缩至4位，显著减少内存占用和计算需求

高精度保持

相比原始模型保持99.75%的精度，性能损失极小

优化推理性能

支持vLLM的Marlin混合精度内核，实现高效推理

文本生成

问答系统

代码生成

文本摘要

对话系统

教育

数学问题解答

解决GSM8K数据集中的数学问题

5-shot准确率45.41%

知识问答

常识推理

AI2 Reasoning Challenge中的推理问题

25-shot准确率63.40%

语言理解

语言理解评估

HellaSwag数据集上的语言理解测试

10-shot准确率84.04%

属性	详情
基础模型	mistralai/Mistral-7B-Instruct-v0.3
量化方法	通过GPTQ将Mistral-7B-Instruct-v0.3进行仅权重量化至4位，分组大小为128
量化目标	相对于未量化模型，实现99.75%的精度恢复
许可证	Apache-2.0

数据集	任务类型	少样本数量	指标类型	指标值
AI2 Reasoning Challenge (25-Shot)	文本生成	25	归一化准确率	63.40
HellaSwag (10-shot)	文本生成	10	归一化准确率	84.04
TruthfulQA (0-shot)	文本生成	0	mc2	57.48
GSM8k (5-shot)	文本生成	5	准确率	45.41
MMLU (5-Shot)	文本生成	5	准确率	61.07
Winogrande (5-shot)	文本生成	5	准确率	79.08

	Mistral-7B-Instruct-v0.3	Mistral-7B-Instruct-v0.3-GPTQ-4bit (本模型)
arc-c 25-shot	63.48	63.40
mmlu 5-shot	61.13	60.89
hellaswag 10-shot	84.49	84.04
winogrande 5-shot	79.16	79.08
gsm8k 5-shot	43.37	45.41
truthfulqa 0-shot	59.65	57.48
平均准确率	65.21	65.05
精度恢复率	100%	99.75%