深度Q学习

# 深度Q学习

这是一个基于 stable-baselines3 库训练的 DQN 智能体模型，专门用于 SpaceInvadersNoFrameskip-v4 游戏环境。

Dqn SpaceInvadersNoFrameskip V4

这是一个基于 DQN 算法的强化学习智能体，专门用于玩 SpaceInvadersNoFrameskip-v4 游戏，使用 stable-baselines3 库训练。

Spaceinvadersnoframeskip V4 2Msteps

这是一个基于 DQN 算法的强化学习智能体，专门用于玩 SpaceInvadersNoFrameskip-v4 游戏，使用 stable-baselines3 库训练。

Dqn Mountaincar V0 Zoo

这是一个基于深度Q网络(DQN)的强化学习智能体，专门用于解决MountainCar-v0环境中的任务。

物理学模型

Dqn Mountaincar V0

这是一个基于深度Q网络(DQN)的强化学习智能体，专门训练用于解决MountainCar-v0环境中的控制问题。

物理学模型

Dqn SpaceInvadersNoFrameskip V4

这是一个基于稳定基线3库训练的DQN智能体，专门用于玩SpaceInvadersNoFrameskip-v4游戏。

Dqn SpaceInvadersNoFrameskip V4

这是一个基于深度Q网络(DQN)的强化学习智能体，专门训练用于玩Atari游戏《太空侵略者》

Dqn PongNoFrameskip V4

这是一个基于DQN算法的强化学习模型，专门用于在PongNoFrameskip-v4环境中进行游戏。

Dqn LunarLander V2

这是一个使用stable-baselines3库训练的DQN智能体，用于解决LunarLander-v2环境中的强化学习任务。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24