JAT开源强化学习模型 - 多模态多任务加持，多种游戏环境表现出色

首页

Jat

由 jat-project 开发

JAT是一个多模态、多任务的强化学习模型，在Atari游戏、BabyAI、MetaWorld和MuJoCo等多种环境中表现出色。

多模态融合

Transformers

其他#多任务强化学习 #Atari游戏控制 #BabyAI任务求解

下载量 71

发布时间 : 1/16/2024

模型简介

JAT是一个通用的强化学习模型，能够处理多种任务和环境，包括游戏、机器人控制和导航等。

模型特点

多任务学习

能够同时在多种不同的强化学习任务和环境上表现优异

通用性强

适用于从游戏到机器人控制等多种强化学习场景

高性能

在多个基准测试中达到或接近专家水平

模型能力

Atari游戏控制

BabyAI任务解决

MetaWorld机器人操作

MuJoCo物理模拟控制

使用案例

游戏AI

Atari游戏玩家

自动玩多种Atari经典游戏

IQM人类标准化总奖励达到0.38

机器人控制

MuJoCo蚂蚁控制

控制MuJoCo模拟环境中的蚂蚁机器人

IQM专家标准化总奖励达到0.85

导航任务

BabyAI任务解决

解决BabyAI环境中的各种导航和对象操作任务

IQM专家标准化总奖励达到0.99

🚀 Jat模型

这是一个多模态、多任务模型，能够在多种任务和场景中发挥作用，为相关领域的应用提供有力支持。

🚀 快速开始

使用以下代码开始使用该模型：

from transformers import AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("jat-project/jat")

✨ 主要特性

多模态与多任务处理能力，可应对多种不同类型的任务。

📚 详细文档

模型详情

模型描述

属性	详情
开发者	JAT团队
许可证	Apache 2.0

模型来源

属性	详情
仓库	https://github.com/huggingface/jat
论文	https://huggingface.co/papers/2402.09844
演示	即将推出

训练情况

该模型在以下任务上进行了训练：

Alien
Amidar
Assault
Asterix
Asteroids
Atlantis
Bank Heist
Battle Zone
Beam Rider
Berzerk
Bowling
Boxing
Breakout
Centipede
Chopper Command
Crazy Climber
Defender
Demon Attack
Double Dunk
Enduro
Fishing Derby
Freeway
Frostbite
Gopher
Gravitar
H.E.R.O.
Ice Hockey
James Bond
Kangaroo
Krull
Kung-Fu Master
Montezuma's Revenge
Ms. Pacman
Name This Game
Phoenix
PitFall
Pong
Private Eye
Q*Bert
River Raid
Road Runner
Robotank
Seaquest
Skiing
Solaris
Space Invaders
Star Gunner
Surround
Tennis
Time Pilot
Tutankham
Up and Down
Venture
Video Pinball
Wizard of Wor
Yars Revenge
Zaxxon
Action Obj Door
Blocked Unlock Pickup
Boss Level No Unlock
Boss Level
Find Obj S5
Go To Door
Go To Imp Unlock
Go To Local
Go To Obj Door
Go To Obj
Go To Red Ball Grey
Go To Red Ball No Dists
Go To Red Ball
Go To Red Blue Ball
Go To Seq
Go To
Key Corridor
Mini Boss Level
Move Two Across S8N9
One Room S8
Open Door
Open Doors Order N4
Open Red Door
Open Two Doors
Open
Pickup Above
Pickup Dist
Pickup Loc
Pickup
Put Next Local
Put Next S7N4
Synth Loc
Synth Seq
Synth
Unblock Pickup
Unlock Local
Unlock Pickup
Unlock To Unlock
Unlock
Assembly
Basketball
BinPicking
Box Close
Button Press Topdown Wall
Button Press Topdown
Button Press Wall
Button Press
Coffee Button
Coffee Pull
Coffee Push
Dial Turn
Disassemble
Door Close
Door Lock
Door Open
Door Unlock
Drawer Close
Drawer Open
Faucet Close
Faucet Open
Hammer
Hand Insert
Handle Press Side
Handle Press
Handle Pull Side
Handle Pull
Lever Pull
Peg Insert Side
Peg Unplug Side
Pick Out Of Hole
Pick Place Wall
Pick Place
Plate Slide Back Side
Plate Slide Back
Plate Slide Side
Plate Slide
Push Back
Push Wall
Push
Reach Wall
Reach
Shelf Place
Soccer
Stick Pull
Stick Push
Sweep Into
Sweep
Window Close
Window Open
Ant
Inverted Double Pendulum
Half Cheetah
Hopper
Humanoid
Inverted Pendulum
Pusher
Reacher
Humanoid Standup
Swimmer
Walker 2d

📄 许可证

该模型使用Apache 2.0许可证。

📚 引用

如果您使用了该模型，请引用以下论文：

@article{gallouedec2024jack,
    title = {{Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent}},
    author = {Gallouédec, Quentin and Beeching, Edward and Romac, Clément and Dellandréa, Emmanuel},
    journal = {arXiv preprint arXiv:2402.09844},
    year = {2024},
    url = {https://arxiv.org/abs/2402.09844}
}