机器人控制

# 机器人控制

Pi0 Pre Train 100

基于LeRobot框架训练的机器人策略模型，适用于机器人控制任务

多模态融合

π0+FAST 是一种面向机器人技术的高效动作标记化方案，由Physical Intelligence设计，适用于视觉-语言-动作任务。

多模态融合

STEVE R1 7B SFT I1 GGUF

这是对Fanbin/STEVE-R1-7B-SFT模型进行的加权/矩阵量化版本，适用于资源受限环境。

文本生成图像英语

Magma是一个多模态AI智能体基础模型，能够处理图像和文本输入并生成文本输出，具备虚拟与现实环境中的复杂交互能力。

图像生成文本

Pi0是一个通用机器人控制的视觉-语言-动作流模型，支持机器人控制任务。

多模态融合

Minivla History2 Vq Libero90 Prismatic

MiniVLA是一个更小体积但性能优异的视觉语言动作模型，兼容Prismatic VLMs训练脚本，适用于机器人技术和多模态任务。

图像生成文本

Transformers 英语

CrossFormer 是一个适用于操作、导航、移动和航空的统一策略模型，旨在跨具身学习中进行规模化应用。

多模态融合

VQ-BeT是针对PushT环境训练的行为生成模型，基于潜在动作原理设计

OpenVLA 7B是一个基于Open X-Embodiment数据集训练的开源视觉-语言-动作模型，能够根据语言指令和摄像头图像生成机器人动作。

图像生成文本

Transformers 英语

HPT是一种将不同实体对齐到共享潜在空间的变换器模型，专注于策略学习中的扩展行为研究。

多模态对齐

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24