P

Ppo PongNoFrameskip V4

由 ThomasSimonini 开发
这是一个基于stable-baselines3库训练的PPO智能体,专门用于玩雅达利游戏PongNoFrameskip-v4。
下载量 148
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用PPO算法训练,能够在PongNoFrameskip-v4游戏中作为绿色方与对手对战,平均奖励达到21分。

模型特点

高性能游戏AI
在PongNoFrameskip-v4游戏中取得平均21分的优秀表现
基于稳定强化学习框架
使用stable-baselines3库实现,这是一个广泛认可的强化学习框架
帧堆叠处理
采用4帧堆叠技术处理游戏画面,提高模型对动态环境的理解能力

模型能力

雅达利游戏PongNoFrameskip-v4对战
强化学习环境交互
实时游戏决策

使用案例

游戏AI
Pong游戏对战
作为AI玩家与人类或其他AI进行Pong游戏对战
平均奖励21分
强化学习研究
作为强化学习算法研究的基准模型