P

Pixtral 12B Captioner Relaxed

由 unalignment 开发
基于Pixtral-12B-2409微调的多模态大语言模型,专注于生成丰富的图像描述
下载量 26
发布时间 : 1/22/2025
模型介绍
内容详情
替代品

模型简介

该模型通过指令微调优化了图像描述生成能力,能够为给定图像生成更全面、更具层次感的细节描述,特别适合构建文本-图像数据集

模型特点

细节增强
生成更全面、更具层次感的图像描述
宽松约束
相比基础模型提供限制更少的图像描述
自然语言定位
用自然语言描述图像中不同主体的位置关系
图像生成优化
输出格式兼容前沿文生图模型

模型能力

图像描述生成
多模态理解
自然语言处理

使用案例

图像数据集构建
自动图像标注
为图像生成详细的文本描述
提高数据集构建效率
辅助创作
文生图模型输入优化
为文生图模型提供更丰富的文本提示
提升生成图像的质量和多样性