S

Structbert Large Zh

由 junnyu 开发
StructBERT是通过将语言结构融入预训练过程扩展BERT的新模型,通过两个辅助任务充分利用词语和句子的顺序结构
下载量 77
发布时间 : 5/18/2022
模型介绍
内容详情
替代品

模型简介

StructBERT是一种改进的BERT模型,通过在预训练中融入语言结构,提升了在词语和句子层面的语言理解能力

模型特点

结构感知预训练
通过两个辅助任务利用词语和句子的顺序结构进行预训练
深度语言理解
在词语和句子层面更好地捕捉语言结构
大规模预训练
基于BERT-large架构,具有3.3亿参数

模型能力

文本分类
自然语言推理
语义相似度计算
问答系统

使用案例

自然语言处理
文本分类
用于新闻分类等任务
在TNEWS数据集上达到68.67%准确率
自然语言推理
判断句子间的逻辑关系
在CMNLI数据集上达到84.47%准确率