Longformer Coreference Ontonotes
基于Longformer-large架构微调的指代消解模型,专为处理长文档设计
下载量 29
发布时间 : 3/2/2022
模型简介
该模型是在OntoNotes数据集上微调的Longformer-large变体,专门用于指代消解任务,能够有效处理长文档中的共指关系识别
模型特点
长文档处理能力
采用稀疏注意力机制,可高效处理长达4096个token的文档序列
领域适应性强
在OntoNotes多领域语料(新闻、电话对话、博客等)上微调,具有广泛适用性
端到端指代消解
需配合文档编码器使用,可完成从文本输入到共指链输出的完整流程
模型能力
长文本指代消解
跨句共指关系识别
多类型指代识别(名词短语、代词等)
使用案例
文本分析
新闻文章实体关联分析
识别新闻长文中多次提及的实体间的指代关系
构建实体共指链,提升信息提取完整性
法律文档解析
分析法律文书中条款引用和实体指代关系
辅助法律文本结构化处理
对话系统
多轮对话理解
追踪对话历史中的代词和省略指代
提升对话系统上下文理解能力
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2