D

Data2vec Vision Base

由 facebook 开发
Data2Vec-Vision是基于BEiT架构的自监督学习模型,在ImageNet-1k数据集上预训练,适用于图像分类任务。
下载量 427
发布时间 : 4/14/2022
模型介绍
内容详情
替代品

模型简介

该模型采用data2vec框架,通过自蒸馏方式学习输入数据的潜在表示,支持计算机视觉任务。

模型特点

通用自监督学习框架
采用统一的data2vec框架,适用于语音、视觉和语言多种模态。
上下文潜在表示预测
通过预测完整输入数据的潜在表示,而非局部特征,获得更丰富的上下文信息。
ImageNet预训练
在包含120万张图像的ImageNet-1k数据集上进行预训练,具备强大的视觉特征提取能力。

模型能力

图像特征提取
图像分类

使用案例

计算机视觉
图像分类
对输入图像进行分类,支持1000个ImageNet类别。
在多个图像分类基准测试中达到或接近最先进水平。