T

Testpushblock

由 rebolforces 开发
一个基于PPO算法训练的深度强化学习智能体,用于Unity的PushBlock游戏环境
下载量 30
发布时间 : 8/20/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Unity ML-Agents框架训练,专门用于解决PushBlock环境中的物体推动任务,展示了强化学习在游戏AI中的应用

模型特点

基于PPO算法
使用Proximal Policy Optimization这一稳定的强化学习算法进行训练
Unity环境集成
专为Unity ML-Agents的PushBlock环境设计,可直接在Unity中部署
持续训练支持
支持通过mlagents-learn命令继续训练模型

模型能力

游戏环境中的决策制定
物体推动任务解决
强化学习策略执行

使用案例

游戏AI
PushBlock游戏AI
在PushBlock环境中自动完成物体推动任务
可观察智能体在浏览器演示中的表现
强化学习研究
PPO算法验证
作为PPO算法在简单3D环境中的实现案例