忒伊亚（theia-base-patch16-224-cdiv）开源模型 - 助力机器人学习的视觉表征神器

首页

Theia Base Patch16 224 Cdiv

由 theaiinstitute 开发

忒伊亚是面向机器人学习的视觉基础模型，通过蒸馏多个现成的视觉基础模型构建，具有丰富的视觉表征能力。

图像分类

Transformers

开源协议:其他 #机器人视觉 #多模型蒸馏 #小样本学习

下载量 7,621

发布时间 : 7/29/2024

模型简介

忒伊亚是一个视觉基础模型，专为机器人学习设计。它通过蒸馏CLIP、DINOv2和ViT等多个视觉基础模型的知识，构建了多样化的视觉表征，能够增强下游机器人学习的性能。

模型特点

多模型蒸馏

通过蒸馏CLIP、DINOv2和ViT等多个视觉基础模型的知识，构建了多样化的视觉表征。

高效学习

在更少训练数据和更小模型规模下，性能优于其教师模型及现有机器人学习模型。

丰富的视觉表征

编码了多样化的视觉知识，可增强下游机器人学习性能。

模型能力

视觉表征学习

机器人视觉任务增强

多模态视觉理解

使用案例

机器人学习

机器人视觉导航

利用忒伊亚的视觉表征能力，增强机器人在复杂环境中的导航能力。

实验证明忒伊亚在更少训练数据和更小模型规模下，性能优于现有模型。

物体识别与抓取

通过忒伊亚的多样化视觉知识，提升机器人对物体的识别和抓取精度。

🚀 Theia

Theia是一个用于机器人学习的视觉基础模型，它提炼了多个针对不同视觉任务训练的现成视觉基础模型。Theia丰富的视觉表征对多样化的视觉知识进行编码，从而提升下游机器人学习的效果。该模型在论文 Theia: Distilling Diverse Vision Foundation Models for Robot Learning 中被提出，论文中的实验表明，Theia在使用更少训练数据和更小模型规模的情况下，性能优于其教师模型和先前的机器人学习模型。演示视频可在项目页面查看。

The AI Institute

🚀 快速开始

Theia是一个用于机器人学习的视觉基础模型，它整合了多个现成视觉基础模型的优势，为下游机器人学习任务提供了丰富的视觉表征，有效提升了学习效果。相关模型权重和代码可在特定许可下使用。

✨ 主要特性

提炼多个针对不同视觉任务训练的现成视觉基础模型。
丰富的视觉表征编码多样化视觉知识，提升下游机器人学习效果。
在使用更少训练数据和更小模型规模的情况下，性能优于其教师模型和先前的机器人学习模型。

📚 详细文档

模型详情

theia-base-patch16-224-cdiv 模型以 DeiT-Base 为骨干网络，同时提炼了 CLIP、DINOv2 和 ViT 的优势。如需了解更多使用信息，请访问 Theia 仓库。

引用说明

如果您在研究中使用了 Theia，请使用以下 BibTeX 条目进行引用：

@article{shang2024theia,
  author    = {Shang, Jinghuan and Schmeckpeper, Karl and May, Brandon B. and Minniti, Maria Vittoria and Kelestemur, Tarik and Watkins, David and Herlant, Laura},
  title     = {Theia: Distilling Diverse Vision Foundation Models for Robot Learning},
  journal   = {arXiv},
  year      = {2024},
}

使用许可

Theia 发布的预训练模型权重和代码可在 The AI Institute License 许可下使用，完整许可内容如下：

Copyright (c) 2024 Boston Dynamics AI Institute LLC

Redistribution and use in source and binary forms, with or without
modification, are permitted provided that the following conditions are met:
1. Redistributions of source code must retain the copyright notice included
with the software, this list of conditions and the following disclaimer.
2. Redistributions in binary form must reproduce the copyright notice, this
list of conditions and the following disclaimer in the documentation and/or
other materials provided with the distribution.
3. Modified versions of the software must be conspicuously marked as such.
4. The software may only be used for non-commercial research purposes.
For profit enterprises may use the software, subject to this limitation.

THIS SOFTWARE IS PROVIDED BY THE AI INSTITUTE AND CONTRIBUTORS "AS IS" AND
ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, NON-
INFRINGEMENT,TITLE, MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
DISCLAIMED. IN NO EVENT SHALL THE AI INSTITUTE OR CONTRIBUTORS BE LIABLE FOR
ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, PUNITIVE OR CONSEQUENTIAL
DAMAGES (INCLUDING, BUT NOT LIMITED TO, DAMAGES ARISING OUT OF CLAIMS OF
INTELLECTUAL PROPERTY RIGHTS INFRINGEMENT; PROCUREMENT OF SUBSTITUTE GOODS OR
SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.