D

Data2vec Vision Large Ft1k

由 facebook 开发
Data2Vec-Vision是一个基于BEiT架构的自监督学习视觉模型,在ImageNet-1k数据集上微调,适用于图像分类任务。
下载量 68
发布时间 : 4/14/2022
模型介绍
内容详情
替代品

模型简介

该模型采用data2vec框架,通过自蒸馏方式学习图像特征,能够将输入图像分类为1000个ImageNet类别。

模型特点

通用自监督学习框架
采用data2vec框架,统一适用于语音、自然语言处理和计算机视觉任务
自蒸馏学习
通过预测完整输入的潜在表征进行训练,而非传统的局部预测目标
高性能图像分类
在ImageNet-1k上达到86.5%的top-1准确率

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
通用图像分类
将任意图像分类为1000个ImageNet类别
top-1准确率86.5%