I

Idefics 9b Instruct

由 HuggingFaceM4 开发
IDEFICS 是 Deepmind 开发的闭源视觉语言模型 Flamingo 的开源复现版本,是一个多模态模型,可以接受任意序列的图像和文本输入,并生成文本输出。
下载量 28.34k
发布时间 : 7/24/2023
模型介绍
内容详情
替代品

模型简介

IDEFICS 是一个大型多模态英语模型,接受交错的图像和文本序列作为输入,并生成文本输出。该模型表现出强大的上下文少样本学习能力,与闭源模型相当。

模型特点

多模态能力
可以同时处理图像和文本输入,生成连贯的文本输出
开源复现
完全基于公开可用的数据和模型构建,复现了闭源 Flamingo 模型的功能
少样本学习
表现出强大的上下文少样本学习能力,与闭源模型相当

模型能力

图像问答
图像描述
多图像故事创作
纯文本语言模型

使用案例

内容生成
图像描述生成
根据输入图像生成详细的文字描述
生成与图像内容高度一致的描述文本
教育
视觉问答
回答关于图像内容的各类问题
准确回答关于图像内容的开放性和选择题