P

Pavit

由 Ajibola 开发
PaViT是基于Pathway Vision Transformer的图像识别模型,灵感来源于谷歌的PaLM,专注于小样本学习技术在图像识别任务中的应用。
下载量 20
发布时间 : 2/23/2023
模型介绍
内容详情
替代品

模型简介

PaViT是一个用于图像识别的Vision Transformer模型,旨在展示在小数据集上的高效学习能力。

模型特点

小样本学习能力
模型在小规模数据集上表现出色,仅用15,000张图像就达到高准确率
CPU高效训练
模型设计为可在4GB内存的CPU上高效训练
可扩展架构
通过增加自注意力头和线性层可进一步提升性能

模型能力

图像分类
多类别识别

使用案例

动物识别
宠物分类
识别猫、狗等宠物类别
在3类动物数据集上表现良好
野生动物识别
识别不同种类的野生动物