M

Moonvit SO 400M

由 moonshotai 开发
MoonViT是一款原生分辨率的视觉编码器,基于SigLIP-SO-400M进行初始化和持续预训练,适用于图像特征提取任务。
下载量 275
发布时间 : 4/10/2025
模型介绍
内容详情
替代品

模型简介

MoonViT是一款专为图像特征提取设计的视觉编码器,其训练基于SigLIP-SO-400M模型,能够处理高分辨率图像并提取有效特征。

模型特点

原生分辨率支持
MoonViT能够处理原生分辨率的图像,无需降采样即可提取特征。
基于SigLIP-SO-400M
模型的初始化和持续预训练均基于SigLIP-SO-400M,继承了其强大的视觉特征提取能力。
高效特征提取
专为图像特征提取优化,能够生成高质量的图像特征表示。

模型能力

图像特征提取
高分辨率图像处理

使用案例

计算机视觉
图像理解
提取图像特征用于后续的图像分类、目标检测等任务。
高质量的图像特征表示
多模态学习
作为视觉编码器与语言模型结合,构建多模态系统。