L

Levit 192

由 facebook 开发
LeViT-192是一种结合了卷积神经网络和Transformer架构的视觉模型,专注于图像分类任务。
下载量 23
发布时间 : 6/1/2022

模型简介

LeViT-192模型在ImageNet-1k数据集上以224x224分辨率进行预训练,结合了卷积神经网络的高效性和Transformer的强大特征提取能力。

模型特点

高效推理
结合卷积神经网络和Transformer架构,实现更快的推理速度。
高精度分类
在ImageNet-1k数据集上预训练,能够准确分类1,000个类别。
教师-学生架构
采用教师-学生架构进行训练,提升模型性能。

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
物体识别
识别图像中的物体类别,如动物、日常用品等。
能够准确分类ImageNet-1k中的1,000个类别。
场景分类
对图像中的场景进行分类,如室内、室外、自然景观等。
AIbase
智启未来,您的人工智能解决方案智库
简体中文