decision-transformer-gym-halfcheetah-expert开源决策模型

首页

Decision Transformer Gym Halfcheetah Expert

由 edbeeching 开发

这是一个经过训练的决策变换器模型，其训练数据来自Gym HalfCheetah环境中采样的专家轨迹。

物理学模型

Transformers

#强化学习控制 #专家轨迹模仿 #连续动作决策

下载量 98

发布时间 : 3/16/2022

模型简介

该模型使用决策变换器架构，专门用于Gym HalfCheetah环境的连续控制任务，能够根据环境状态预测最优动作。

模型特点

专家轨迹训练

模型使用Gym HalfCheetah环境中采样的专家轨迹进行训练，能够学习专家策略。

状态归一化

提供详细的归一化系数(均值和标准差)，确保输入状态正确处理。

序列决策

基于Transformer架构，能够处理序列决策问题，考虑历史状态信息。

模型能力

连续动作空间控制

强化学习策略预测

机器人控制仿真

使用案例

机器人控制

HalfCheetah仿真控制

在Gym HalfCheetah环境中实现高效的运动控制

能够学习专家策略，实现类似专家的控制效果

强化学习研究

决策变换器应用研究

作为决策变换器在连续控制任务中的应用案例

验证决策变换器在Mujoco环境中的有效性

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Decision Transformer Gym Halfcheetah Expert

模型简介

模型特点

模型能力

使用案例

🚀 基于Gym HalfCheetah环境专家轨迹训练的决策变压器模型

🚀 快速开始