Quasar-3.0-Instract-v2开源模型 - 展示架构潜力，助力多样应用场景

首页

Quasar 3.0 Instract V2

由 silx-ai 开发

Quasar-3.0-7B是即将发布的400B Quasar 3.0模型的蒸馏版本，展示了Quasar架构的早期实力和潜力。

大型语言模型

Transformers

#强化学习优化 #词元温度机制 #高效推理

下载量 314

发布时间 : 4/6/2025

模型简介

基于《推理中的黄金公式》论文技术构建，采用TTM（词元温度机制）训练流程和强化学习最佳公式，优化推理和上下文聚焦。

模型特点

TTM训练机制

创新的词元温度机制，优化训练过程中的推理和上下文聚焦能力

强化学习优化

应用了作者认为迄今为止最佳的强化学习训练公式

架构潜力展示

7B版本已展示出Quasar架构的竞争力，预示着400B完整模型的强大能力

模型能力

文本生成

复杂推理

上下文理解

使用案例

AI研究与开发

模型架构研究

研究新型TTM训练机制和强化学习公式的效果

可作为新型训练方法的参考实现

商业应用

智能助手

构建需要复杂推理能力的对话系统

推断：可能提供更精准的上下文理解和回答

🚀 类星体（Quasar）系列模型

类星体（Quasar）系列模型由SILX INC提供，旨在借助创新的训练机制和强化学习方法，提升模型的推理能力和上下文聚焦能力，为人工智能领域的推理技术带来新的突破。

🚀 快速开始

模型信息

属性	详情
基础模型	Quasar-400B-X
库名称	transformers
模型名称	Quasar-3.0-Max
标签	rl、silx、trl、sft
许可证	license

模型图片

Quasar Model Image

✨ 主要特性

🌟 类星体3.0（Quasar-3.0）介绍

类星体3.0-7B（Quasar-3.0-7B）是即将推出的400B类星体3.0模型的蒸馏版本。它基于《推理中的黄金公式》（Golden Formula in Reasoning）论文中的创新成果构建，采用了一种名为TTM（令牌温度机制，Token Temperature Mechanism） 的全新训练管道，这是一种在训练过程中优化推理和上下文聚焦的新方法。此外，还应用了目前认为是最佳的强化学习（RL）训练公式。