B

Blip Image Captioning Large Mocha

由 moranyanuka 开发
这是BLIP-Large模型的官方微调版本,采用MOCHa强化学习框架在MS-COCO数据集上进行微调,旨在缓解开放词汇描述幻觉问题
下载量 188
发布时间 : 12/19/2023
模型介绍
内容详情
替代品

模型简介

基于BLIP-Large架构的图像描述生成模型,支持条件式与非条件式图像描述生成

模型特点

MOCHa微调
采用MOCHa强化学习框架在MS-COCO数据集上进行微调
缓解描述幻觉
专门针对开放词汇描述幻觉问题进行优化
双模式生成
支持条件式与非条件式两种图像描述生成方式

模型能力

图像描述生成
条件式文本生成
视觉语言理解

使用案例

图像理解
自动图像标注
为图像生成准确的描述性文本
生成符合图像内容的自然语言描述
辅助视觉障碍人士
将视觉内容转换为文字描述
帮助视觉障碍者理解图像内容
内容创作
社交媒体内容生成
为上传的图片自动生成配文
提高内容创作效率