P

Ppo Pushblock 9M

由 rebolforces 开发
这是一个基于PPO算法的强化学习智能体,专门训练用于解决Unity ML-Agents中的PushBlock游戏任务。
下载量 19
发布时间 : 8/21/2022
模型介绍
内容详情
替代品

模型简介

该模型使用PPO(近端策略优化)算法训练,能够在PushBlock环境中有效地推动方块到目标位置。

模型特点

基于PPO算法
使用近端策略优化算法,这是一种稳定且高效的强化学习算法
900万步训练
模型经过了900万步的充分训练,在PushBlock任务上表现良好
Unity集成
可以直接在Unity环境中部署和运行

模型能力

解决PushBlock游戏任务
学习推动方块到目标位置
适应Unity物理环境

使用案例

游戏AI
PushBlock游戏解决方案
作为PushBlock游戏的AI解决方案
能够稳定地将方块推到目标位置
强化学习研究
PPO算法演示
作为PPO算法在Unity环境中的实现案例