RBT4开源中文预训练模型 - 加速自然语言处理，免费助力中文研究

首页

Rbt4

由 hfl 开发

这是一个采用全词掩码策略的中文预训练BERT模型，由哈工大讯飞联合实验室发布，旨在加速中文自然语言处理研究。

大型语言模型中文开源协议:Apache-2.0 #全词掩码预训练 #中文自然语言处理 #轻量级BERT

下载量 22

发布时间 : 3/2/2022

模型简介

该模型是基于谷歌BERT架构的中文预训练语言模型，采用全词掩码策略进行训练，适用于各种中文自然语言处理任务。

模型特点

全词掩码策略

采用全词掩码而非单字掩码，更符合中文语言特点，提升模型理解能力。

中文优化

专门针对中文语言特点进行优化训练，在中文NLP任务上表现优异。

轻量级架构

采用4层精简架构，在保持性能的同时提高推理效率。

模型能力

中文文本理解

文本分类

命名实体识别

问答系统

文本相似度计算

使用案例

文本分析

情感分析

分析中文文本的情感倾向

在中文情感分析任务上表现优异

命名实体识别

识别中文文本中的人名、地名、机构名等实体

准确识别中文特有命名实体

问答系统

中文问答

构建基于中文的问答系统

能够理解中文问题并给出准确回答

🚀 四层RoBERTa-wwm-ext再训练模型

本项目提供了一个经过再训练的四层RoBERTa-wwm-ext模型，旨在进一步加速中文自然语言处理任务。

🚀 快速开始

此项目提供了经过再训练的四层RoBERTa - wwm - ext模型，为中文自然语言处理提供了更高效的解决方案。

✨ 主要特性

全词掩码预训练：本项目提供了带全词掩码的中文预训练BERT模型，有助于提升中文自然语言处理的效果。
多模型关联：该仓库基于https://github.com/google-research/bert开发，同时还关联了一系列相关的中文预训练模型仓库，如中文BERT系列、中文MacBERT等。
资源丰富：由HFL提供了更多相关资源，可查看HFL文集。

📚 详细文档

📄 许可证

本项目采用Apache - 2.0许可证。

📚 引用信息

如果你发现本技术报告或资源有用，请在论文中引用以下技术报告：

主要引用

论文链接：https://arxiv.org/abs/2004.13922

@inproceedings{cui-etal-2020-revisiting,
    title = "Revisiting Pre-Trained Models for {C}hinese Natural Language Processing",
    author = "Cui, Yiming  and
      Che, Wanxiang  and
      Liu, Ting  and
      Qin, Bing  and
      Wang, Shijin  and
      Hu, Guoping",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.58",
    pages = "657--668",
}

次要引用

论文链接：https://arxiv.org/abs/1906.08101

@article{chinese-bert-wwm,
  title={Pre-Training with Whole Word Masking for Chinese BERT},
  author={Cui, Yiming and Che, Wanxiang and Liu, Ting and Qin, Bing and Yang, Ziqing and Wang, Shijin and Hu, Guoping},
  journal={arXiv preprint arXiv:1906.08101},
  year={2019}
 }