X

Xlm Roberta Longformer Base 4096

由 markussagen 开发
基于XLM-R扩展的长序列处理模型,支持最长4096标记的序列处理,适用于多语言任务
下载量 9,499
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过Longformer预训练方案扩展XLM-RoBERTa的序列处理能力,旨在为低资源语言提供高效的长文本处理解决方案

模型特点

超长序列处理
支持4096标记的序列长度(原XLM-R仅支持512),适合处理长文档
低资源语言优化
无需为每种语言单独预训练,特别优化瑞典语等低资源语言支持
高效训练方案
采用梯度累积(64步)和16位精度训练,降低显存需求

模型能力

长文本理解
多语言问答
跨语言迁移学习

使用案例

问答系统
多语言文档问答
处理长文档中的跨语言问答任务
文本分析
低资源语言处理
对瑞典语等低资源语言的长文本进行分析