开源忒伊亚视觉模型 - 支持机器人学习，具备丰富视觉表征能力

首页

Theia Tiny Patch16 224 Cdiv

由 theaiinstitute 开发

忒伊亚是面向机器人学习的视觉基础模型，通过蒸馏多个现成的视觉基础模型而成，具有丰富的视觉表征能力。

图像分类

Transformers

开源协议:其他 #机器人视觉 #多模型蒸馏 #小样本学习

下载量 50

发布时间 : 7/29/2024

模型简介

忒伊亚是一个视觉基础模型，专为机器人学习设计。它通过蒸馏多个针对不同视觉任务训练的视觉基础模型（如CLIP、DINOv2和ViT）而成，能够编码多样化的视觉知识，从而增强下游的机器人学习任务。

模型特点

多模型蒸馏

通过蒸馏多个现成的视觉基础模型（CLIP、DINOv2、ViT），整合了多样化的视觉知识。

高效性能

在更少的训练数据和更小的模型规模下，性能超越教师模型和先前的机器人学习模型。

机器人学习优化

专为机器人学习设计，提供丰富的视觉表征，增强下游任务性能。

模型能力

视觉表征学习

机器人视觉任务增强

多模态视觉知识整合

使用案例

机器人学习

机器人视觉导航

利用忒伊亚的视觉表征能力，增强机器人在复杂环境中的导航能力。

在更少的训练数据下实现更高的导航精度。

物体识别与抓取

通过忒伊亚的多样化视觉知识，提升机器人对物体的识别和抓取能力。

在小型模型规模下实现与大型模型相当的性能。

🚀 Theia

Theia是一款用于机器人学习的视觉基础模型，它融合了多个针对不同视觉任务训练的现成视觉基础模型。Theia丰富的视觉表征对多样化的视觉知识进行编码，从而提升下游机器人学习的效果。该模型在论文Theia: Distilling Diverse Vision Foundation Models for Robot Learning中被首次提出，论文中的实验表明，Theia在使用更少的训练数据和更小的模型规模的情况下，性能优于其教师模型和先前的机器人学习模型。演示视频可在项目页面查看。

The AI Institute

✨ 主要特性

Theia模型能够融合多种视觉基础模型的优势，通过蒸馏技术将不同模型的知识进行整合，为机器人学习提供丰富且有效的视觉表征。其在较少训练数据和较小模型规模下的出色表现，使其在实际应用中具有更高的效率和更低的成本。

📚 详细文档

模型详情

theia-tiny-patch16-224-cdiv 模型以 DeiT-Tiny 为骨干网络，同时蒸馏了 CLIP、DINOv2 和 ViT 的知识。如需了解更多使用信息，请访问 Theia 代码仓库。

引用信息

如果您在研究中使用了 Theia，请使用以下 BibTeX 引用：

@article{shang2024theia,
  author    = {Shang, Jinghuan and Schmeckpeper, Karl and May, Brandon B. and Minniti, Maria Vittoria and Kelestemur, Tarik and Watkins, David and Herlant, Laura},
  title     = {Theia: Distilling Diverse Vision Foundation Models for Robot Learning},
  journal   = {arXiv},
  year      = {2024},
}

使用许可

Theia 发布的预训练模型权重和代码遵循 The AI Institute License，完整许可内容如下：

Copyright (c) 2024 Boston Dynamics AI Institute LLC

Redistribution and use in source and binary forms, with or without
modification, are permitted provided that the following conditions are met:
1. Redistributions of source code must retain the copyright notice included
with the software, this list of conditions and the following disclaimer.
2. Redistributions in binary form must reproduce the copyright notice, this
list of conditions and the following disclaimer in the documentation and/or
other materials provided with the distribution.
3. Modified versions of the software must be conspicuously marked as such.
4. The software may only be used for non-commercial research purposes.
For profit enterprises may use the software, subject to this limitation.

THIS SOFTWARE IS PROVIDED BY THE AI INSTITUTE AND CONTRIBUTORS "AS IS" AND
ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, NON-
INFRINGEMENT,TITLE, MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
DISCLAIMED. IN NO EVENT SHALL THE AI INSTITUTE OR CONTRIBUTORS BE LIABLE FOR
ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, PUNITIVE OR CONSEQUENTIAL
DAMAGES (INCLUDING, BUT NOT LIMITED TO, DAMAGES ARISING OUT OF CLAIMS OF
INTELLECTUAL PROPERTY RIGHTS INFRINGEMENT; PROCUREMENT OF SUBSTITUTE GOODS OR
SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.