H

Hiera Base 224 Hf

由 facebook 开发
Hiera是一种层次化视觉Transformer模型,具有快速、强大且简洁的特点,在图像和视频任务中表现优异。
下载量 163
发布时间 : 5/12/2024
模型介绍
内容详情
替代品

模型简介

Hiera是一种高效的层次化视觉Transformer模型,专为图像分类、特征提取和掩码图像建模设计,通过简化传统Transformer结构实现更高效率。

模型特点

高效层次化设计
通过初始减少特征数量、后期降低空间分辨率的层次化设计,显著提升运行效率。
简化结构
移除传统Transformer冗余模块,通过MAE训练方法让模型自主学习空间偏置特性,保持结构简洁。
优异性能
在多项图像和视频识别任务中超越现有技术,同时显著提升运行速度。

模型能力

图像分类
特征提取
掩码图像建模

使用案例

计算机视觉
图像分类
对图像进行高效准确的分类识别
特征提取
提取图像不同阶段的特征图,用于下游任务