D

Decision Transformer Gym Hopper Medium

由 edbeeching 开发
这是一个在Gym Hopper环境中使用中等表现轨迹训练的决策变换器模型,适用于连续控制任务。
下载量 6,518
发布时间 : 3/16/2022
模型介绍
内容详情
替代品

模型简介

该模型基于决策变换器架构,专门针对Gym Hopper环境的连续控制任务进行训练,能够根据环境状态生成相应的动作决策。

模型特点

基于轨迹的决策生成
模型通过学习中等表现轨迹来生成决策,适用于连续控制任务。
状态归一化
提供详细的归一化系数,确保输入状态正确处理。
强化学习应用
专为强化学习环境设计,特别适合Gym Hopper等连续控制任务。

模型能力

连续动作空间决策
强化学习环境控制
轨迹学习

使用案例

机器人控制
Hopper机器人运动控制
控制Hopper机器人的跳跃和平衡
实现中等水平的运动性能
强化学习研究
决策变换器算法验证
用于验证决策变换器在连续控制任务中的表现