decision-transformer-gym-hopper-medium开源模型 - 助力连续控制任务决策优化

首页

Decision Transformer Gym Hopper Medium

由 edbeeching 开发

这是一个在Gym Hopper环境中使用中等表现轨迹训练的决策变换器模型，适用于连续控制任务。

物理学模型

Transformers

#强化学习控制 #轨迹决策优化 #连续动作空间

下载量 6,518

发布时间 : 3/16/2022

模型简介

该模型基于决策变换器架构，专门针对Gym Hopper环境的连续控制任务进行训练，能够根据环境状态生成相应的动作决策。

模型特点

基于轨迹的决策生成

模型通过学习中等表现轨迹来生成决策，适用于连续控制任务。

状态归一化

提供详细的归一化系数，确保输入状态正确处理。

强化学习应用

专为强化学习环境设计，特别适合Gym Hopper等连续控制任务。

模型能力

连续动作空间决策

强化学习环境控制

轨迹学习

使用案例

机器人控制

Hopper机器人运动控制

控制Hopper机器人的跳跃和平衡

实现中等水平的运动性能

强化学习研究

决策变换器算法验证

用于验证决策变换器在连续控制任务中的表现

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Decision Transformer Gym Hopper Medium

模型简介

模型特点

模型能力

使用案例

🚀 决策变压器模型（基于Gym Hopper环境的中等轨迹训练）

🚀 快速开始