L

Longformer Base 4096 Finetuned Squadv2

由 mrm8488 开发
该模型是基于Longformer架构,在SQuAD v2问答数据集上微调的问答系统,支持处理长文本序列(最长4096个token)。
下载量 190
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

Longformer-base-4096是一个专为长文档设计的Transformer模型,基于RoBERTa初始化,并在SQuAD v2数据集上进行了问答任务微调。它结合了滑动窗口局部注意力和全局注意力机制,适合处理长文档问答任务。

模型特点

长文本处理能力
支持最长4096个token的序列,适合处理长文档问答任务
混合注意力机制
结合滑动窗口局部注意力和全局注意力,在保持效率的同时捕捉长距离依赖关系
高精度问答
在SQuAD v2验证集上达到79.92%的精确匹配率和83.35%的F1分数

模型能力

长文本问答
开放域问答
无答案检测

使用案例

文档问答系统
法律文档分析
从长法律文档中提取特定问题的答案
研究报告问答
回答关于学术论文或技术报告的问题
客户支持
FAQ自动回答
从长产品文档中回答客户问题