D

Deberta V2 Xlarge Mnli

由 microsoft 开发
DeBERTa V2 XLarge是微软推出的增强型自然语言理解模型,通过解耦注意力机制和增强型掩码解码器改进BERT架构,在多项NLU任务上超越BERT和RoBERTa的表现。
下载量 51.59k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

基于解耦注意力机制的改进型BERT架构,专注于自然语言理解任务,在GLUE和SQuAD等基准测试中表现优异。

模型特点

解耦注意力机制
分离内容和位置注意力计算,增强模型对文本位置关系的理解能力
增强型掩码解码器
改进的掩码语言建模目标,更好地捕捉上下文依赖关系
大规模预训练
使用80GB训练数据进行预训练,学习更丰富的语言表示

模型能力

文本分类
问答系统
语义相似度计算
自然语言推理
句子对分类

使用案例

文本理解
情感分析
分析文本情感倾向(正面/负面)
在SST-2数据集上达到97.5%准确率
问答系统
回答基于给定文本的问题
在SQuAD 2.0上F1得分91.4,EM得分88.9
语义分析
语义相似度判断
判断两个句子的语义相似程度
在STS-B数据集上皮尔逊相关系数92.9
自然语言推理
判断文本间的逻辑关系(蕴含/矛盾/中立)
在MNLI数据集上准确率91.7%(匹配)/91.6%(不匹配)