C

Chinese Roberta L 4 H 768

由 uer 开发
基于CLUECorpusSmall预训练的24个中文RoBERTa模型系列之一,采用UER-py框架训练,支持掩码语言建模和文本特征提取。
下载量 17
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是中文RoBERTa系列的中型版本,具有8层网络和512维隐藏层,适用于多种中文自然语言处理任务。

模型特点

多尺寸选择
提供24种不同规模的模型配置,从超小型到基础型,满足不同计算资源需求
中文优化
专门针对中文文本进行预训练,在CLUE基准测试中表现优异
两阶段训练
采用128和512两种序列长度的两阶段训练策略,提升模型表现

模型能力

文本特征提取
掩码语言预测
中文文本理解

使用案例

文本理解
情感分析
分析用户评论的情感倾向
在中文情感分析任务上达到94.8%准确率
文本分类
对新闻或应用进行分类
在CLUE新闻分类任务上达到65.6%准确率
语义理解
句子匹配
判断两个句子的语义相似度
在句子匹配任务上达到88.1%准确率
自然语言推理
判断文本间的逻辑关系
在CLUE自然语言推理任务上达到71.2%准确率