Q

Quasar 3.0 Final

由 silx-ai 开发
Quasar-3.0-Max是SILX INC提供的7B参数蒸馏模型,展示了Quasar架构的早期潜力,采用创新的TTM训练流程和强化学习技术。
下载量 118
发布时间 : 4/6/2025
模型介绍
内容详情
替代品

模型简介

Quasar-3.0-Max是基于《推理中的黄金公式》论文技术构建的蒸馏模型,采用令牌温度机制(TTM)优化推理和上下文聚焦,并应用强化学习训练公式。

模型特点

令牌温度机制(TTM)
创新的训练流程,优化推理和上下文聚焦能力
强化学习训练公式
应用了被认为是最佳的强化学习训练方法
蒸馏技术
从即将发布的400B Quasar 3.0模型蒸馏而来

模型能力

文本生成
复杂推理
上下文理解

使用案例

AI研究与开发
模型架构研究
研究新型训练方法和架构设计
展示了Quasar架构的潜力
商业应用
智能助手
构建具有高级推理能力的AI助手