D

Data2vec Vision Base Ft1k

由 facebook 开发
Data2Vec-Vision是基于BEiT架构的自监督学习模型,在ImageNet-1k数据集上微调,适用于图像分类任务。
下载量 7,520
发布时间 : 4/14/2022
模型介绍
内容详情
替代品

模型简介

该模型采用自监督方式进行预训练,并在ImageNet-1k数据集上以224x224分辨率进行微调,可用于将图像分类为1000个类别。

模型特点

自监督学习
采用自监督学习框架,通过掩码输入预测完整输入的潜在表征。
多模态统一框架
data2vec框架可统一处理语音、自然语言处理和计算机视觉任务。
高性能图像分类
在ImageNet-1k上达到83.97%的top-1准确率。

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
图像分类
将图像分类为1000个ImageNet类别之一。
在ImageNet-1k上达到83.97%的top-1准确率。