I

Instructblip Flan T5 Xxl 8bit Nf4

由 Mediocreatmybest 开发
InstructBLIP是BLIP-2的视觉指令调优版本,结合了视觉和语言模型,能够根据图像和文本指令生成描述或回答问题。
下载量 22
发布时间 : 8/21/2023
模型介绍
内容详情
替代品

模型简介

该模型采用Flan-T5-xxl作为语言模型,通过指令调优实现通用的视觉-语言任务处理能力。

模型特点

视觉指令调优
通过指令调优使模型能够理解和执行基于图像的复杂指令
多模态处理
同时处理视觉和语言输入,实现跨模态理解
8位量化支持
支持使用bitsandbytes进行8位/nf4量化,降低资源需求

模型能力

图像描述生成
视觉问答
跨模态理解
指令跟随

使用案例

图像理解
图像异常检测
识别并描述图像中的不寻常之处
可准确指出图像中的异常元素
辅助功能
视觉辅助
为视障人士描述图像内容
生成详细准确的图像描述