S

Sac Walker2d V3

由 sb3 开发
这是一个基于SAC算法的强化学习模型,专为Walker2d-v3环境设计,能够控制双足机器人行走。
下载量 43
发布时间 : 6/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用stable-baselines3库中的SAC算法训练,用于解决Walker2d-v3环境中的连续控制任务,实现双足机器人的稳定行走。

模型特点

高效连续控制
使用SAC算法优化连续动作空间的控制策略
稳定训练
模型在训练过程中表现出稳定的学习曲线
RL Zoo集成
与RL Zoo训练框架无缝集成,便于超参数优化和模型共享

模型能力

双足机器人控制
连续动作空间优化
强化学习策略训练

使用案例

机器人控制
双足机器人行走
控制双足机器人在仿真环境中实现稳定行走
平均奖励达到3876.28 +/- 75.51