L

Longformer Coreference Ontonotes

由 shtoshni 开发
基于Longformer-large架构微调的指代消解模型,专为处理长文档设计
下载量 29
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是在OntoNotes数据集上微调的Longformer-large变体,专门用于指代消解任务,能够有效处理长文档中的共指关系识别

模型特点

长文档处理能力
采用稀疏注意力机制,可高效处理长达4096个token的文档序列
领域适应性强
在OntoNotes多领域语料(新闻、电话对话、博客等)上微调,具有广泛适用性
端到端指代消解
需配合文档编码器使用,可完成从文本输入到共指链输出的完整流程

模型能力

长文本指代消解
跨句共指关系识别
多类型指代识别(名词短语、代词等)

使用案例

文本分析
新闻文章实体关联分析
识别新闻长文中多次提及的实体间的指代关系
构建实体共指链,提升信息提取完整性
法律文档解析
分析法律文书中条款引用和实体指代关系
辅助法律文本结构化处理
对话系统
多轮对话理解
追踪对话历史中的代词和省略指代
提升对话系统上下文理解能力