Q

Qhub Blip Image Captioning Finetuned

由 quadranttechnologies 开发
针对零售产品图像视觉问答任务微调后的BLIP模型版本,基于在线零售平台的图像和产品描述标注的自定义数据集进行了微调。
下载量 369
发布时间 : 11/7/2024

模型简介

该模型用于零售行业中对产品图像进行问答,支持产品元数据增强、人工生成产品描述的验证等应用场景。

模型特点

零售场景优化
针对零售产品图像进行了专门微调,能准确识别和描述各类商品
多模态理解
结合视觉和语言信息,实现图像到文本的转换
条件式生成
支持基于提示文本的条件式图像描述生成

模型能力

图像描述生成
产品识别
视觉问答
零售场景理解

使用案例

电子商务
产品元数据增强
自动为电商平台上的产品图像生成描述性文本
如准确识别并描述'凯膳怡专业立式搅拌机'等产品
产品描述验证
验证人工编写的产品描述是否与图像内容匹配
零售分析
货架商品识别
识别零售货架上的商品并生成描述
如准确识别'布什牌白豆罐头'等商品
AIbase
智启未来,您的人工智能解决方案智库
简体中文