Q

Qwenlong L1 32B

由 Tongyi-Zhiwen 开发
QwenLong-L1是基于强化学习训练的长上下文大推理模型,在七个长上下文文档问答基准测试中表现优异。
下载量 683
发布时间 : 5/23/2025
模型介绍
内容详情
替代品

模型简介

QwenLong-L1是一个通过强化学习训练的长上下文大推理模型,专注于处理长文档问答任务,具有强大的推理能力和上下文理解能力。

模型特点

强化学习训练
采用强化学习框架训练,包含预热监督微调、课程引导RL阶段和难度感知的回顾采样机制。
长上下文处理
支持高达131,072个token的上下文长度,通过YaRN方法实现RoPE缩放。
多领域推理能力
在数学推理、逻辑推理和多跳推理等多个领域表现出色。

模型能力

长文本理解
复杂推理
多跳问答
数学推理
逻辑分析

使用案例

文档问答
财务报告分析
从长篇财务报告中提取关键信息并回答相关问题。
在DocMath基准测试中表现优异。
法律文档理解
解析复杂的法律文档并回答相关问题。
在法律领域的逻辑推理任务中表现良好。
多跳推理
跨文档信息整合
从多个相关文档中整合信息回答复杂问题。
在MultiHopRAG和Musique数据集上表现良好。