M

Mistral Small 3.1 24B Instruct 2503 Quantized.w4a16

由 RedHatAI 开发
这是一个经过INT4量化的Mistral-Small-3.1-24B-Instruct-2503模型,由Red Hat (Neural Magic)优化发布,适用于快速响应的对话代理和低延迟推理场景。
下载量 219
发布时间 : 4/15/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于Mistral-Small-3.1-24B-Instruct-2503进行INT4权重量化的版本,减少了约75%的磁盘大小和GPU内存需求,同时保持较好的性能。

模型特点

高效量化
采用INT4权重量化,减少75%的磁盘大小和GPU内存需求
多语言支持
支持24种语言的文本理解和生成
多模态能力
具备文本和图像理解能力
低延迟推理
优化后适合快速响应的对话代理和函数调用

模型能力

文本生成
对话代理
编程推理
数学推理
长文档理解
视觉理解
多语言处理

使用案例

对话系统
智能客服
用于构建快速响应的客户服务对话系统
低延迟响应,支持多语言
代码辅助
编程助手
帮助开发者理解和生成代码
支持多种编程语言的代码补全和解释
文档处理
长文档摘要
自动生成长文档的摘要和关键点
支持8192 tokens的长上下文理解