C

Clip Vit Base Patch32 Lego Brick

由 armaggheddon97 开发
基于CLIP模型微调的乐高积木图像-文本匹配模型,专为识别乐高积木及其描述设计。
下载量 44
发布时间 : 1/24/2025
模型介绍
内容详情
替代品

模型简介

此模型是在乐高积木描述数据集上微调的CLIP模型,用于准确匹配乐高积木图像与其对应的文本描述,帮助用户通过描述或图片找到特定积木。

模型特点

高精度匹配
模型经过微调,能够以高置信度准确匹配乐高积木图像与文本描述。
零样本分类
支持零样本图像分类,无需额外训练即可对新类别进行分类。
多模态处理
同时处理图像和文本输入,生成对应的嵌入向量。

模型能力

图像分类
文本-图像匹配
生成图像嵌入
生成文本嵌入

使用案例

乐高积木识别
积木搜索
通过文本描述或上传图片查找特定乐高积木。
模型能够以高置信度返回最匹配的积木结果。
零样本分类
对新的乐高积木类别进行分类,无需额外训练。
在测试数据集上准确率达到99.23%。