L

Levit 128S

由 facebook 开发
LeViT-128S是基于ImageNet-1k数据集预训练的视觉Transformer模型,结合了卷积网络的优势以实现更快推理。
下载量 3,198
发布时间 : 6/1/2022
模型介绍
内容详情
替代品

模型简介

LeViT是一种结合了卷积网络和Transformer架构的视觉模型,专为图像分类任务设计,在保持高准确率的同时优化了推理速度。

模型特点

混合架构设计
结合卷积网络和Transformer的优势,在保持视觉任务性能的同时优化计算效率。
高效推理
专为快速推理设计,相比纯Transformer架构具有更低的计算开销。
ImageNet预训练
在ImageNet-1k数据集上预训练,可直接用于千类图像分类任务。

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
通用物体识别
识别图像中的常见物体(如动物、日常用品等)
可准确分类ImageNet的1,000个类别
场景理解
分析图像场景内容(如室内外环境、建筑类型等)