R

RADIO B

由 nvidia 开发
RADIO是由NVIDIA研究院开发的视觉基础模型,能够将不同领域的视觉信息统一表征,适用于多种视觉任务。
下载量 999
发布时间 : 7/23/2024
模型介绍
内容详情
替代品

模型简介

RADIO是一个视觉基础模型,能够生成图像的整体概念表征和局部内容表征,适用于语义分割等密集任务或与大型语言模型集成。

模型特点

统一表征
能够将不同领域的视觉信息统一表征,实现万域归一。
双输出
同时输出图像整体概念表征和局部内容表征,适用于多种下游任务。
高效下采样
通过14x14的补丁尺寸实现高效的空间特征提取。

模型能力

图像整体概念表征
局部内容表征
语义分割
视觉-语言模型集成

使用案例

计算机视觉
语义分割
利用模型输出的空间特征进行像素级分类
视觉-语言集成
将图像表征与大型语言模型结合,实现多模态理解