Quasar-3.0-Final开源AI模型 - 创新技术支持，释放架构早期潜力！

首页

Quasar 3.0 Final

由 silx-ai 开发

Quasar-3.0-Max是SILX INC提供的7B参数蒸馏模型，展示了Quasar架构的早期潜力，采用创新的TTM训练流程和强化学习技术。

大型语言模型

Transformers

#令牌温度机制 #强化学习优化 #高效推理

下载量 118

发布时间 : 4/6/2025

模型简介

Quasar-3.0-Max是基于《推理中的黄金公式》论文技术构建的蒸馏模型，采用令牌温度机制(TTM)优化推理和上下文聚焦，并应用强化学习训练公式。

模型特点

令牌温度机制(TTM)

创新的训练流程，优化推理和上下文聚焦能力

强化学习训练公式

应用了被认为是最佳的强化学习训练方法

蒸馏技术

从即将发布的400B Quasar 3.0模型蒸馏而来

模型能力

文本生成

复杂推理

上下文理解

使用案例

AI研究与开发

模型架构研究

研究新型训练方法和架构设计

展示了Quasar架构的潜力

商业应用

智能助手

构建具有高级推理能力的AI助手

🚀 类星体系列模型

类星体系列模型由SILX INC提供，旨在通过创新的训练机制和方法，提升模型在推理和上下文聚焦方面的能力，为人工智能领域的推理能力带来新的突破。

🚀 快速开始

模型信息

属性	详情
基础模型	Quasar-400B-X
库名称	transformers
模型名称	Quasar-3.0-Max
标签	rl、silx、trl、sft
许可证	license

模型图片

类星体模型图片

✨ 主要特性

介绍类星体3.0

此模型由SILX INC提供，类星体3.0 - 7B是即将推出的400B类星体3.0模型的蒸馏版本。它基于《推理中的黄金公式》（Golden Formula in Reasoning）论文中的创新成果构建，具有一种名为TTM（令牌温度机制） 的新型训练管道 —— 这是一种在训练过程中优化推理和上下文聚焦的新方法。我们还应用了我们认为迄今为止强化学习（RL）训练的最佳公式。