D

Deberta V2 Xxlarge

由 microsoft 开发
DeBERTa V2 XXLarge是基于解耦注意力与增强掩码解码的改进型BERT模型,具有15亿参数,在多项自然语言理解任务上超越BERT和RoBERTa表现
下载量 9,179
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

DeBERTa通过创新的解耦注意力机制和增强型掩码解码器改进了BERT架构,该XXLarge版本具有48层网络和1536维隐藏层,训练数据达160GB,在GLUE和SQuAD等基准测试中表现优异

模型特点

解耦注意力机制
将内容和位置注意力分离计算,更精确建模文本依赖关系
增强掩码解码器
改进的掩码语言建模目标,考虑绝对位置信息提升预测能力
大规模预训练
使用160GB高质量文本数据进行训练,学习更丰富的语言表示

模型能力

文本理解
语义分析
问答系统
文本分类
自然语言推理

使用案例

学术研究
GLUE基准测试
在通用语言理解评估基准上实现最先进性能
MNLI准确率91.7%,SST-2情感分析97.2%
工业应用
智能客服
用于理解用户查询意图和生成响应
文档分析
自动分类和提取合同/报告中的关键信息