L

Llama 3.1 8B UltraLong 2M Instruct

由 nvidia 开发
Nemotron-UltraLong-8B系列是专为处理超长文本序列设计的语言模型,支持最高200万标记的上下文窗口,同时保持卓越性能。
下载量 1,088
发布时间 : 3/4/2025
模型介绍
内容详情
替代品

模型简介

基于Llama-3.1架构的超长上下文语言模型,通过高效持续预训练与指令微调提升长文本理解能力,适用于需要处理超长文本序列的应用场景。

模型特点

超长上下文支持
支持最高200万标记的上下文窗口,能够处理超长文本序列。
高效训练方案
结合持续预训练与指令微调,显著提升长上下文理解能力。
多领域适应性
在通用、数学和代码领域均有出色表现,适用于多样化任务。

模型能力

超长文本理解
指令遵循
文本生成
数学推理
代码生成

使用案例

长文档处理
法律文档分析
分析超长法律合同和文档,提取关键条款和信息。
能够准确理解并提取200万标记长度文档中的关键信息。
学术研究
论文摘要生成
阅读并总结超长学术论文,生成简洁摘要。
在RULER等长文本评估基准中表现优异。