blip-image-captioning-base-bf16开源模型 - 减少内存占用实现图像到文本生成

首页

Blip Image Captioning Base Bf16

由 gospacedev 开发

该模型是Salesforce/blip-image-captioning-base的量化版本，通过降低浮点精度至bfloat16，内存占用减少50%，适用于图像到文本生成任务。

图像生成文本

Transformers

开源协议:MIT #图像描述生成 #bfloat16量化 #轻量化模型

下载量 20

发布时间 : 4/27/2024

模型简介

Blip图像描述生成基础版BF16是一个图像到文本生成模型，能够根据输入的图像生成对应的文本描述。通过量化技术，模型体积减小，适合资源受限的环境使用。

模型特点

量化技术

通过将浮点精度从float32降低至bfloat16，模型内存占用减少50%，从989MB缩减至494MB。

图像到文本生成

能够根据输入的图像生成准确且流畅的文本描述。

轻量化

适合在资源受限的环境中部署和使用。

模型能力

图像描述生成

图像理解

文本生成

使用案例

图像描述

生成图像描述

输入一张图像，模型生成对应的文本描述。

例如：一只猫坐在紫红色条纹地毯上

辅助工具

视觉辅助

为视觉障碍者提供图像的文字描述。


一只猫坐在紫色和红色条纹的地毯上

属性	详情
开发者	Grantley Cullar
模型类型	图像转文本
语言（NLP）	英语
许可证	MIT许可证

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Blip Image Captioning Base Bf16

模型简介

模型特点

模型能力

使用案例

🚀 Blip图像描述基础BF16

🚀 快速开始

💻 使用示例

基础用法

📚 详细文档

模型详情

📄 许可证