Rbt3开源中文预训练模型 - 加速中文自然语言处理应用发展

首页

Rbt3

由 hfl 开发

这是一个采用全词掩码技术的中文预训练BERT模型，由哈工大讯飞联合实验室开发，旨在加速中文自然语言处理的发展。

大型语言模型中文开源协议:Apache-2.0 #全词掩码预训练 #中文自然语言处理 #BERT变体优化

下载量 6,626

发布时间 : 3/2/2022

模型简介

该模型基于RoBERTa-wwm-ext架构重新训练，专注于中文文本处理，支持填充掩码任务。

模型特点

全词掩码技术

采用全词掩码而非单字掩码，更符合中文语言特点，提升模型理解能力。

中文优化

专门针对中文文本进行优化训练，在中文NLP任务中表现优异。

轻量级架构

采用三层结构，相比完整BERT模型更轻量高效。

模型能力

中文文本理解

填充掩码预测

上下文语义分析

使用案例

自然语言处理

文本填空

预测文本中被掩码遮盖的词语

准确预测符合上下文语义的词语

文本分类

对中文文本进行分类任务

在各类中文文本分类任务中表现良好

🚀 重新训练的3层RoBERTa-wwm-ext模型

本项目提供了一个重新训练的3层RoBERTa-wwm-ext模型，旨在进一步加速中文自然语言处理任务，为相关领域的研究和应用提供有力支持。

✨ 主要特性

中文全词掩码预训练BERT

为了进一步加速中文自然语言处理，我们提供了采用全词掩码的中文预训练BERT模型。

Pre-Training with Whole Word Masking for Chinese BERT
Yiming Cui, Wanxiang Che, Ting Liu, Bing Qin, Ziqing Yang, Shijin Wang, Guoping Hu

项目开发基础

本仓库基于以下项目开发：https://github.com/google-research/bert

📄 许可证

本项目采用Apache-2.0许可证。

📚 详细文档

引用说明

如果您发现本技术报告或资源有用，请在您的论文中引用以下技术报告：

主要引用: https://arxiv.org/abs/2004.13922

@inproceedings{cui-etal-2020-revisiting,
    title = "Revisiting Pre-Trained Models for {C}hinese Natural Language Processing",
    author = "Cui, Yiming  and
      Che, Wanxiang  and
      Liu, Ting  and
      Qin, Bing  and
      Wang, Shijin  and
      Hu, Guoping",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.58",
    pages = "657--668",
}

次要引用: https://arxiv.org/abs/1906.08101

@article{chinese-bert-wwm,
  title={Pre-Training with Whole Word Masking for Chinese BERT},
  author={Cui, Yiming and Che, Wanxiang and Liu, Ting and Qin, Bing and Yang, Ziqing and Wang, Shijin and Hu, Guoping},
  journal={arXiv preprint arXiv:1906.08101},
  year={2019}
 }