基于Google Vision Transformer (ViT)微调的时尚系列分类模型,可识别15个顶级时尚品牌的服装系列。
下载量 38
发布时间 : 12/28/2023
模型简介
该模型用于对时尚图像进行分类,能够识别来自15个不同时尚品牌的服装系列。基于Vogue Runway数据集训练,适用于时尚产业的分析和检索应用。
模型特点
高准确率
在评估集上达到94.54%的准确率,能够可靠地区分不同时尚品牌系列
广泛覆盖
涵盖15个顶级时尚品牌,包含1679个系列共计87,547张图片
基于ViT架构
使用Google Vision Transformer (ViT)作为基础模型,具有优秀的图像理解能力
模型能力
时尚图像分类
品牌识别
系列识别
使用案例
时尚产业
时尚趋势分析
分析不同品牌和季节的时尚趋势
可自动分类大量时尚图片,提高分析效率
电子商务
为时尚电商平台提供自动分类功能
帮助用户快速找到特定品牌或风格的商品
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文