H

Hiera Base 224 In1k Hf

由 facebook 开发
Hiera是一种分层式视觉Transformer模型,兼具快速、强大且简洁的特点,在广泛图像与视频任务中超越现有技术水平的同时显著提升了运行速度。
下载量 188
发布时间 : 5/12/2024

模型简介

Hiera是一种无需繁复设计的层次化视觉Transformer,专为图像分类任务优化,通过简化架构和MAE训练方法实现高效性能。

模型特点

高效分层设计
采用层次化结构,早期层减少特征数量,后期层降低空间分辨率,显著提升运行效率。
简化架构
移除了传统视觉Transformer中的冗余模块,通过MAE训练教导模型学习空间偏置,保持架构简洁。
高性能
在多项图像视频识别任务中实现技术突破,准确率超越现有技术水平。

模型能力

图像分类
特征提取
掩码图像建模

使用案例

计算机视觉
图像分类
对输入图像进行分类识别
示例输出:'虎斑猫'
AIbase
智启未来,您的人工智能解决方案智库
简体中文