G

Git Base Captioning Ft Hl Narratives

由 michelecafagna26 开发
该模型是基于GIT架构的图像描述生成模型,在HL Narratives数据集上微调,专门用于生成高层次叙事性图像描述。
下载量 19
发布时间 : 7/24/2023
模型介绍
内容详情
替代品

模型简介

该模型能够根据输入图像生成具有叙事性的自然语言描述,特别擅长捕捉图像中的高层次语义和故事性内容。

模型特点

叙事性描述生成
能够生成具有故事性和上下文感知的图像描述,而不仅仅是简单的对象识别
高质量微调
在专门的HL Narratives数据集上进行微调,提升了生成描述的叙事质量
高效推理
支持半精度(fp16)推理,提高了推理效率

模型能力

图像描述生成
叙事性文本生成
视觉内容理解

使用案例

社交媒体
自动图片描述
为社交媒体图片自动生成富有故事性的描述
生成类似'她正在海滩上摆姿势拍照,想发布到社交媒体上'的描述
辅助技术
视觉辅助
为视障人士提供更丰富的图像描述