D

Decision Transformer Gym Halfcheetah Expert

由 edbeeching 开发
这是一个经过训练的决策变换器模型,其训练数据来自Gym HalfCheetah环境中采样的专家轨迹。
下载量 98
发布时间 : 3/16/2022
模型介绍
内容详情
替代品

模型简介

该模型使用决策变换器架构,专门用于Gym HalfCheetah环境的连续控制任务,能够根据环境状态预测最优动作。

模型特点

专家轨迹训练
模型使用Gym HalfCheetah环境中采样的专家轨迹进行训练,能够学习专家策略。
状态归一化
提供详细的归一化系数(均值和标准差),确保输入状态正确处理。
序列决策
基于Transformer架构,能够处理序列决策问题,考虑历史状态信息。

模型能力

连续动作空间控制
强化学习策略预测
机器人控制仿真

使用案例

机器人控制
HalfCheetah仿真控制
在Gym HalfCheetah环境中实现高效的运动控制
能够学习专家策略,实现类似专家的控制效果
强化学习研究
决策变换器应用研究
作为决策变换器在连续控制任务中的应用案例
验证决策变换器在Mujoco环境中的有效性