M

Mlagents Pyramids

由 a-doering 开发
这是一个基于PPO算法的强化学习智能体,在Unity的ML-Agents金字塔环境中训练完成
下载量 14
发布时间 : 7/5/2022
模型介绍
内容详情
替代品

模型简介

该模型是通过Unity ML-Agents框架训练的深度强化学习智能体,使用PPO算法在金字塔环境中学习导航和任务解决能力

模型特点

基于Unity环境训练
在Unity的3D金字塔环境中进行训练,具备处理复杂3D空间导航的能力
PPO算法实现
采用Proximal Policy Optimization算法,平衡探索与利用,实现稳定的策略学习
实时可视化
支持在浏览器中实时观看智能体运行表现

模型能力

3D环境导航
障碍物避让
目标导向行为
强化学习策略优化

使用案例

游戏AI
NPC智能导航
可用于游戏中NPC在复杂3D环境中的自主导航
机器人控制
虚拟机器人训练
可作为真实机器人控制策略的虚拟训练环境