P

Pixtral 12b Quantized.w8a8

由 RedHatAI 开发
基于mgoin/pixtral-12b的INT8量化版本,支持视觉-文本多模态任务,优化了推理效率
下载量 309
发布时间 : 2/8/2025
模型介绍
内容详情
替代品

模型简介

这是一个经过INT8权重量化和激活量化的多模态模型,支持视觉输入和文本输出,适用于图像理解和生成任务

模型特点

高效INT8量化
权重量化和激活量化均为INT8,显著提升推理效率
多模态支持
支持视觉输入和文本输出,能够处理图像和文本的联合任务
vLLM优化
专为vLLM推理引擎优化,支持高效部署
高精度保持
量化后保持了原始模型97%以上的准确率

模型能力

视觉问答
图像内容描述
文档理解
图表分析
多模态推理

使用案例

视觉问答
图像内容理解
回答关于图像内容的自然语言问题
在VQAv2验证集上达到78.00准确率
文档分析
文档问答
从扫描文档中提取信息并回答问题
在DocVQA验证集上达到89.35 ANLS分数
图表理解
图表数据分析
解释图表内容并回答相关问题
在ChartQA测试集上达到81.60准确率