Qwen2.5-1.5B-Instruct开源模型 - 支持本地微调的指令学习好帮手

Qwen2.5 1.5B Instruct

由 Gensyn 开发

专为Gensyn RL Swarm设计的1.5B参数指令微调模型，支持通过点对点强化学习进行本地微调

下载量 2.1M

发布时间 : 4/4/2025

模型简介

基于Qwen2.5架构的指令微调语言模型，适用于文本生成任务，特别为分布式强化学习训练优化

分布式强化学习优化

专为Gensyn RL Swarm系统设计，支持点对点强化学习微调

高效架构设计

采用RoPE、SwiGLU激活函数和RMSNorm等先进技术

长上下文支持

完整支持32,768令牌上下文，生成支持8,192令牌

分组查询注意力

使用12查询头和2键值头的GQA架构，提高推理效率

文本生成

指令跟随

聊天对话

分布式AI训练

RL Swarm训练节点

作为分布式强化学习网络的参与节点进行模型微调

对话系统

智能聊天助手

部署为对话式AI，理解并回应用户指令

属性	详情
模型类型	因果语言模型
训练阶段	预训练和后训练
架构	带有旋转位置编码（RoPE）、SwiGLU激活函数、RMS归一化（RMSNorm）、注意力QKV偏置和绑定词嵌入的Transformer架构
参数数量	15.4亿
非嵌入参数数量	13.1亿
层数	28
注意力头数量（分组查询注意力GQA）	查询（Q）为12，键值（KV）为2
上下文长度	完整32768个标记，生成8192个标记