decision-transformer-gym-hopper-expert开源模型 - 基于专家轨迹提升决策能力

首页

Decision Transformer Gym Hopper Expert

由 edbeeching 开发

这是一个经过训练的决策变换器模型，其训练数据来源于Gym Hopper环境中的专家轨迹。

物理学模型

Transformers

#强化学习控制 #连续动作决策 #轨迹模仿学习

下载量 727

发布时间 : 3/16/2022

模型简介

该模型使用决策变换器架构，专门针对Gym Hopper连续控制环境进行训练，能够根据环境状态生成有效的控制策略。

模型特点

专家轨迹训练

模型基于Gym Hopper环境中的专家轨迹数据进行训练，能够学习到高质量的控制策略。

决策变换器架构

采用创新的决策变换器架构，将强化学习问题转化为序列建模问题。

归一化处理

提供详细的输入归一化系数，确保模型输入数据在正确的分布范围内。

模型能力

连续动作空间控制

强化学习策略生成

机器人控制模拟

使用案例

机器人控制

Hopper机器人控制

在Gym Hopper环境中控制机器人完成跳跃和平衡任务

能够生成有效的控制策略使机器人保持平衡和移动

强化学习研究

决策变换器算法验证

用于研究和验证决策变换器在连续控制任务中的表现

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Decision Transformer Gym Hopper Expert

模型简介

模型特点

模型能力

使用案例

🚀 决策变换器模型（基于Gym Hopper环境专家轨迹训练）

🚀 快速开始

📚 详细文档