R

Roformer Chinese Char Small

由 junnyu 开发
RoFormer是基于旋转位置编码(Rotary Position Embedding)增强的中文Transformer模型,适用于文本填充任务。
下载量 24
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用旋转位置编码技术,相比传统Transformer在长文本处理上表现更好,特别适合中文文本的掩码预测任务。

模型特点

旋转位置编码
采用创新的旋转位置编码(RoPE)技术,相比传统位置编码能更好地处理长序列依赖关系
中文优化
专门针对中文文本处理进行优化,在字符级任务上表现优异
多框架支持
同时提供PyTorch和TensorFlow 2.0版本实现

模型能力

文本填充
掩码预测
中文文本理解

使用案例

文本补全
句子补全
预测句子中被掩码遮盖的部分
能准确预测符合语境的词语
语言模型预训练
下游任务微调
可作为预训练模型用于各种NLP下游任务