MLAgents - Pyramids开源强化学习模型，免费体验金字塔环境训练

首页

Mlagents Pyramids

由 Forkits 开发

这是一个基于PPO算法的强化学习模型，使用Unity ML-Agents在金字塔环境中训练

分子模型

TensorBoard

#Unity强化学习 #金字塔环境导航 #PPO算法

下载量 19

发布时间 : 6/25/2022

模型简介

该模型是一个深度强化学习智能体，专门为Unity的Pyramids环境训练，使用PPO算法学习在3D环境中导航和完成任务

模型特点

Unity环境集成

专为Unity 3D环境设计，可直接在Unity模拟器中运行

PPO算法实现

使用Proximal Policy Optimization算法，稳定高效的强化学习训练

3D导航能力

能够在复杂的3D金字塔环境中自主导航和完成任务

模型能力

3D环境导航

强化学习决策

Unity环境交互

使用案例

游戏AI

自主导航NPC

可作为游戏中的非玩家角色，在复杂3D环境中自主移动

实现智能路径规划和环境交互

机器人模拟

虚拟机器人训练

用于训练虚拟机器人在复杂环境中的移动能力

为真实机器人控制提供模拟训练基础

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Mlagents Pyramids

模型简介

模型特点

模型能力

使用案例

🚀 ppo 智能体玩金字塔游戏

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

恢复训练

高级用法

观看智能体游戏

Mlagents Pyramids

模型简介

模型特点

模型能力

使用案例

🚀 ppo 智能体玩 金字塔 游戏

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

恢复训练

高级用法

观看智能体游戏

🚀 ppo 智能体玩金字塔游戏