H

Hiera Huge 224 Hf

由 facebook 开发
Hiera是一种高效的分层视觉Transformer模型,在图像和视频任务中表现优异且运行速度快
下载量 41
发布时间 : 5/12/2024
模型介绍
内容详情
替代品

模型简介

Hiera是一种分层的视觉Transformer模型,设计简洁高效,通过MAE训练方法简化了传统视觉Transformer的冗余模块,在多项图像视频识别任务中超越现有技术

模型特点

分层设计
采用分层架构,早期层减少特征数量,深层网络降低空间分辨率,提高效率
简洁架构
通过MAE训练方法简化或移除了传统Transformer中的冗余模块,保持高效
高性能
在多项图像和视频识别任务中超越现有技术,同时运行速度显著提升

模型能力

图像分类
特征提取
掩码图像建模

使用案例

计算机视觉
图像分类
对图像内容进行分类识别
在ImageNet-1K等基准测试中表现优异
特征提取
从图像中提取多层次的特征表示
可用于下游视觉任务的迁移学习