S

Sam Hq Vit Huge

由 syscv-community 开发
SAM-HQ是Segment Anything Model(SAM)的增强版本,能够生成更高质量的物体掩码,特别适合处理复杂结构的物体。
下载量 516
发布时间 : 5/5/2025
模型介绍
内容详情
替代品

模型简介

SAM-HQ通过引入高质量输出令牌和全局-局部特征融合技术,显著提升了分割掩码的质量,同时保持了原版SAM的可提示设计、效率和零样本泛化能力。

模型特点

高质量输出令牌
专门设计的可学习令牌,注入到掩码解码器中,负责预测更精确的分割掩码。
全局-局部特征融合
将掩码解码器特征与早期和最终的ViT特征融合,结合高级语义和低级边界信息,改善掩码细节。
高效改进
仅增加不到0.5%的参数,训练时间仅需8个GPU上的4小时,即可显著提升分割质量。
零样本泛化
保持原版SAM的零样本泛化能力,可在未见过的数据上直接应用。

模型能力

高质量图像分割
基于提示的分割(点、框等)
自动掩码生成
零样本迁移学习

使用案例

图像编辑
精确物体提取
从复杂背景中精确分割物体,保留细节和薄结构
相比原版SAM,能更好地保留物体边界细节
自动化标注
高质量数据标注
自动生成精确的物体掩码用于训练数据标注
减少人工标注工作量,提高标注质量
医学图像分析
医学结构分割
分割医学图像中的精细结构
适用于需要高精度分割的医学应用