T

Theia Base Patch16 224 Cddsv

由 theaiinstitute 开发
忒伊亚是一个面向机器人学习的视觉基础模型,通过蒸馏多个视觉基础模型获得丰富的视觉表征能力
下载量 5,404
发布时间 : 9/30/2024
模型介绍
内容详情
替代品

模型简介

忒伊亚是一个蒸馏了多个视觉基础模型的机器人学习专用视觉模型,能够增强下游机器人学习任务的性能。实验证明其在更少训练数据和更小模型规模下优于现有模型。

模型特点

多模型蒸馏
同时蒸馏了CLIP、Depth Anything、DINOv2、Segment Anything和ViT五个视觉基础模型的知识
高效学习
在更少训练数据和更小模型规模下性能优于教师模型
多样化视觉表征
编码了丰富的视觉知识,适用于多种机器人学习任务

模型能力

视觉特征提取
深度估计
图像分割
视觉表征学习

使用案例

机器人学习
机器人视觉导航
利用丰富的视觉表征辅助机器人进行环境理解和导航
在少量训练数据下实现优于传统模型的性能
物体识别与操作
结合多种视觉知识进行物体识别和操作任务