D

Decision Transformer Gym Walker2d Expert

由 edbeeching 开发
这是一个经过训练的决策变换器模型,其训练数据来源于Gym Walker2d环境中采样的专家轨迹。
下载量 14
发布时间 : 3/16/2022
模型介绍
内容详情
替代品

模型简介

该模型使用决策变换器架构,专门针对Gym Walker2d连续控制环境进行训练,能够生成有效的控制策略。

模型特点

专家轨迹训练
模型基于Gym Walker2d环境中采样的专家轨迹进行训练
标准化处理
提供完整的标准化系数,包括均值和标准差
连续控制能力
专门针对Walker2d等连续控制环境优化

模型能力

连续动作空间控制
强化学习策略生成
机器人运动控制

使用案例

机器人控制
双足机器人行走控制
应用于双足机器人行走策略生成
可实现稳定的行走控制
强化学习研究
决策变换器算法验证
用于验证决策变换器在连续控制任务中的表现