U

Unitypyramidsrnd

由 jakka 开发
这是一个基于PPO算法的强化学习智能体,专门为Unity的ML-Agents金字塔环境训练而成。
下载量 15
发布时间 : 7/24/2022
模型介绍
内容详情
替代品

模型简介

该模型使用PPO(近端策略优化)算法在Unity的ML-Agents金字塔环境中进行训练,能够在该环境中执行特定任务。

模型特点

Unity环境集成
专为Unity ML-Agents金字塔环境设计,可直接在Unity中部署使用
PPO算法
采用近端策略优化算法,平衡探索与利用,实现稳定的策略学习
可视化演示
支持通过Hugging Face Spaces直接观看智能体在环境中的表现

模型能力

环境导航
任务执行
强化学习决策

使用案例

游戏AI
金字塔环境导航
智能体在金字塔迷宫中寻找路径完成任务
可观察智能体在环境中的决策过程
强化学习研究
PPO算法演示
作为PPO算法在3D环境中的应用案例
可用于教学或算法比较