X

Xlm Roberta Longformer Base 4096

由 Peltarion 开发
基于XLM-RoBERTa扩展的长序列模型,支持最长4096标记的序列处理,适用于多语言任务
下载量 64
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

XLM-R长序列模型是XLM-RoBERTa的扩展版本,通过特殊预训练方案支持更长的序列处理(原版仅支持512标记)。该模型在多语言问答等任务上表现优异,特别适合低资源语言场景。

模型特点

超长上下文支持
支持最长4096个标记的序列处理(原版XLM-R仅支持512标记)
低资源语言优化
无需为每种语言单独预训练,特别适合瑞典语等低资源语言场景
高效训练方案
采用梯度累积技术(64步)和16位精度训练,降低显存需求

模型能力

长文本理解
多语言问答
跨语言迁移学习

使用案例

问答系统
多语言长文档问答
处理包含长上下文的跨语言问答任务
文本理解
低资源语言文档分析
对瑞典语等低资源语言的长文档进行语义分析