I

Internlm XComposer2 Enhanced

由 Coobiw 开发
基于InternLM2开发的视觉语言大模型,具备卓越的图文理解与创作能力
下载量 14
发布时间 : 2/13/2025
模型介绍
内容详情
替代品

模型简介

InternLM-XComposer2是基于InternLM2开发的视觉语言大模型(VLLM),具备卓越的图文理解与创作能力。包含两个版本:InternLM-XComposer2-VL(多模态预训练模型)和InternLM-XComposer2(专为自由式图文交错创作任务微调的视觉语言模型)。

模型特点

多模态理解与创作
具备卓越的图文理解与创作能力,支持自由式图文交错创作
双版本模型
提供VL预训练模型和专为图文创作优化的微调模型
高效推理
支持批量化训练与flash-attn加速功能

模型能力

图像理解
文本生成
图文交错创作
视觉问答

使用案例

内容创作
图文博客创作
根据图片自动生成详细描述和配套文字内容
生成符合图片内容的自然语言描述
智能问答
视觉问答
回答关于图片内容的各类问题
准确理解图片内容并提供相关回答