C

Chinese Macbert Large

由 hfl 开发
MacBERT是一种改进的中文BERT模型,采用M作为校正的掩码语言模型预训练任务,缓解了预训练与微调阶段的不一致问题。
下载量 13.05k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

MacBERT是一种改进的中文BERT模型,通过使用相似词进行掩码而非传统的[MASK]标记,结合全词掩码、N-gram掩码和句子顺序预测等技术,提升了中文自然语言处理任务的性能。

模型特点

校正式MLM
使用相似词进行掩码而非[MASK]标记,缓解预训练与微调阶段的不一致问题
全词掩码
采用全词掩码技术,提升模型对中文词语的理解能力
N-gram掩码
支持N-gram级别的掩码,增强模型对长文本的理解
句子顺序预测
整合句子顺序预测任务,提升模型对文本连贯性的理解

模型能力

中文文本理解
文本分类
命名实体识别
问答系统
文本相似度计算

使用案例

自然语言处理
中文文本分类
用于中文文本的情感分析、主题分类等任务
命名实体识别
识别中文文本中的人名、地名、机构名等实体
问答系统
构建中文问答系统,回答基于文本的问题