C

Chinesebert Large

由 junnyu 开发
ChineseBERT是一个融合字形与拼音信息的中文预训练模型,通过增强字形特征提升中文理解能力
下载量 21
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型通过结合汉字字形结构(五笔/笔画)和拼音信息增强传统BERT的中文处理能力,适用于中文文本理解与生成任务

模型特点

字形增强
整合汉字五笔编码和笔画顺序特征,增强模型对中文形态的理解
拼音融合
结合汉字拼音信息,解决中文同音字歧义问题
预训练优化
专门针对中文特性设计的预训练目标,提升语义捕获能力

模型能力

中文文本理解
掩码词预测
中文语义表示学习

使用案例

文本补全
中文完形填空
预测被掩码的中文词汇
示例中'北京是[MASK]国的首都'正确预测为'中'(准确率83.41%)
教育应用
中文学习辅助
基于字形特征的错别字检测与纠正