M

Mistral Small 24B Instruct 2501 GPTQ G128 W4A16 MSE

由 ConfidentialMind 开发
这是mistralai/Mistral-Small-24B-Instruct-2501模型的4位量化版本,由ConfidentialMind.com量化,实现了更小、更快的模型,同时性能损失极小。
下载量 93
发布时间 : 2/15/2025
模型介绍
内容详情
替代品

模型简介

基于Mistral-Small-24B-Instruct-2501的4位量化模型,主要用于文本生成任务,适用于需要高效推理的场景。

模型特点

高效4位量化
使用GPTQ技术实现4位精度量化,显著减少模型大小和推理时间。
组大小128
采用组大小128的量化策略,平衡了模型精度和推理效率。
MSE优化
使用MSE(均方误差)和较高的阻尼因子进行量化优化,减少损失和困惑度。
单GPU支持
优化后可在单个NVIDIA A100 GPU(80GB显存)上高效运行。

模型能力

文本生成
高效推理
量化模型部署

使用案例

高效文本生成
快速内容生成
在资源受限环境下快速生成高质量文本内容。
在保持较高生成质量的同时显著提升推理速度。
研究应用
量化技术研究
作为大模型量化技术的研究案例。
展示4位量化在大语言模型上的应用效果。