I

Imp V1.5 4B Phi3

由 MILVLG 开发
Imp-v1.5-4B-Phi3是一个高性能轻量级多模态大模型,仅含40亿参数,基于Phi-3框架和SigLIP视觉编码器构建。
下载量 140
发布时间 : 5/20/2024
模型介绍
内容详情
替代品

模型简介

该模型致力于打造高性能轻量级多模态大模型,通过百万级混合数据集训练而成,适用于多种视觉语言任务。

模型特点

轻量级设计
仅含40亿参数,相比同类模型更轻量,适合资源有限的环境。
高性能多模态
结合文本和视觉信息处理能力,在多个基准测试上表现优异。
高效视觉编码
采用SigLIP视觉编码器,有效处理图像输入。

模型能力

文本生成
图像理解
视觉问答
多模态推理

使用案例

教育
视觉问答
回答关于图像内容的各类问题
在VQAv2数据集上达到81.5分
研究
多模态基准测试
用于评估多模态模型的综合能力
在MME(P)基准上达到1507.7分