C

C RADIOv2 G

由 nvidia 开发
C-RADIOv2是NVIDIA开发的视觉特征提取模型,提供多种规格版本,适用于图像理解和密集处理任务。
下载量 648
发布时间 : 1/17/2025
模型介绍
内容详情
替代品

模型简介

该模型用于执行视觉特征提取任务,生成的图像嵌入可被下游模型用于图像分类、语义分割等应用。

模型特点

多规格版本
提供基础版、大型版、巨型版和超巨型版四种规格,满足不同计算需求
高效特征提取
生成全局和局部图像嵌入,适用于图像级理解和密集处理任务
高分辨率支持
支持16像素为增量的分辨率,最高可达2048x2028
数据平衡技术
采用逆频率采样和PHI标准化技术优化训练数据分布

模型能力

图像特征提取
图像分类
语义分割
深度估计
视觉语言模型集成

使用案例

计算机视觉
图像分类
使用模型提取的图像嵌入进行图像分类任务
语义分割
利用模型的空间特征进行像素级语义分割
多模态应用
视觉语言模型
将图像特征集成到大型语言模型中