T

Testworm

由 curt-tigges 开发
一个基于PPO算法的强化学习智能体,专门训练用于玩贪吃蛇游戏
下载量 85
发布时间 : 9/5/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Unity ML-Agents框架训练,采用PPO(近端策略优化)算法,能够自主玩贪吃蛇游戏。

模型特点

基于PPO算法
使用近端策略优化算法进行训练,这是一种先进的强化学习算法
Unity ML-Agents集成
完全兼容Unity ML-Agents框架,便于在Unity环境中部署和运行
贪吃蛇游戏专精
专门为贪吃蛇游戏训练,能够自主决策并完成游戏目标

模型能力

贪吃蛇游戏控制
强化学习决策
游戏策略优化

使用案例

游戏AI
贪吃蛇游戏AI
作为贪吃蛇游戏的AI对手或演示AI
能够自主完成贪吃蛇游戏
强化学习教学
PPO算法示例
作为PPO算法的实际应用案例
展示PPO算法在简单游戏中的表现