B

Bert Large Cantonese

由 hon9kon9ize 开发
基于粤语文本从头训练的大型BERT模型,适用于粤语文本的掩码语言建模任务
下载量 448
发布时间 : 5/7/2024
模型介绍
内容详情
替代品

模型简介

该模型是专门针对粤语训练的大型BERT模型,能够处理粤语文本的掩码预测任务,适用于粤语自然语言处理应用

模型特点

粤语专用
专门针对粤语文本训练,能更好地理解和处理粤语特有的词汇和语法结构
大型架构
采用BERT-large架构,具有更强的语言理解能力
两阶段训练
采用两阶段训练策略,先在短序列上预训练,再在长序列上微调

模型能力

粤语文本理解
掩码语言建模
粤语词汇预测

使用案例

自然语言处理
粤语文本补全
自动补全粤语句子中的缺失部分
能准确预测粤语特有的词汇和表达方式
粤语语法分析
分析粤语特有的语法结构