D

Dimple 7B

由 rp-yu 开发
Dimple是首个结合自回归与扩散训练范式的离散扩散多模态大语言模型(DMLLM),在LLaVA-NEXT相同数据集上训练后,以3.9%的优势超越LLaVA-NEXT-7B。
下载量 422
发布时间 : 5/19/2025
模型介绍
内容详情
替代品

模型简介

Dimple是一个多模态大语言模型,结合了自回归与扩散训练范式,支持图像文本到文本的任务。

模型特点

混合训练
融合自回归与扩散训练范式,增强模型性能。
扩散解码
支持置信解码、随机解码、maskgit式解码及基于熵的解码。
可控生成
通过结构先验实现格式、结构与长度的细粒度控制。
类自回归预填充
采用预填充技术提升推理速度。

模型能力

图像描述生成
多模态指令跟随
文本生成
图像分析

使用案例

多模态交互
图像描述
生成对图像的详细描述。
生成自然且准确的图像描述。
视觉问答
回答关于图像内容的问题。
提供准确且上下文相关的答案。