P

Ppo SeaquestNoFrameskip V4

由 ThomasSimonini 开发
这是一个使用stable-baselines3库训练的PPO智能体模型,专门用于玩雅达利游戏SeaquestNoFrameskip-v4。
下载量 205
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型基于PPO算法训练,能够在Seaquest游戏中取得较高分数。模型使用CNN策略处理游戏画面,并通过强化学习不断优化游戏策略。

模型特点

高性能游戏AI
在Seaquest游戏中平均获得1820分,表现优异
稳定训练框架
基于stable-baselines3库开发,训练过程稳定可靠
帧堆叠处理
使用4帧堆叠技术处理游戏画面,提升模型对动态环境的理解

模型能力

雅达利游戏控制
强化学习决策
游戏画面理解

使用案例

游戏AI
Seaquest游戏自动玩家
模型可以自动玩Seaquest游戏并取得高分
平均奖励1820分
强化学习研究
PPO算法基准测试
可作为PPO算法在雅达利游戏上的性能基准