M

Modernbert Large Squad2 V0.1

由 Praise2112 开发
基于ModernBERT-large在SQuAD 2.0数据集上微调的问答模型,支持长上下文处理
下载量 19
发布时间 : 1/11/2025
模型介绍
内容详情
替代品

模型简介

该模型是基于ModernBERT-large架构在SQuAD 2.0数据集上微调的问答模型,特别擅长处理长文档的问答任务,原生支持8192个标记的上下文长度。

模型特点

长上下文支持
原生支持8192个标记的上下文长度,适合处理长文档问答
高效架构
采用旋转位置嵌入(RoPE)和局部-全局交替注意力机制,提高长输入处理效率
高性能问答
在SQuAD 2.0数据集上达到86.27的exact match分数和89.30的F1分数

模型能力

长文档问答
文本理解
信息提取

使用案例

文档处理
技术文档问答
从长技术文档中提取准确答案
可准确回答文档中的技术问题
法律文档分析
分析法律合同和条款
能从复杂法律文本中提取关键信息
知识检索
企业知识库问答
构建企业知识问答系统
可处理大量企业文档并提供准确回答