Q

Qwen2.5 1.5B Instruct

由 Gensyn 开发
专为Gensyn RL Swarm设计的1.5B参数指令微调模型,支持通过点对点强化学习进行本地微调
下载量 2.1M
发布时间 : 4/4/2025
模型介绍
内容详情
替代品

模型简介

基于Qwen2.5架构的指令微调语言模型,适用于文本生成任务,特别为分布式强化学习训练优化

模型特点

分布式强化学习优化
专为Gensyn RL Swarm系统设计,支持点对点强化学习微调
高效架构设计
采用RoPE、SwiGLU激活函数和RMSNorm等先进技术
长上下文支持
完整支持32,768令牌上下文,生成支持8,192令牌
分组查询注意力
使用12查询头和2键值头的GQA架构,提高推理效率

模型能力

文本生成
指令跟随
聊天对话

使用案例

分布式AI训练
RL Swarm训练节点
作为分布式强化学习网络的参与节点进行模型微调
对话系统
智能聊天助手
部署为对话式AI,理解并回应用户指令