R

Roberta Classical Chinese Large Char

由 KoichiYasuoka 开发
基于文言文文本预训练的RoBERTa模型,支持繁体/简体汉字,适用于古文处理任务
下载量 33
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于文言文文本预训练的RoBERTa模型,源自古文BERT大型版。字符嵌入增强了对繁体/简体汉字的支持,可用于下游任务微调。

模型特点

文言文专用
专门针对文言文文本进行预训练,优化了对古文的理解和处理能力
字符级支持
增强了对繁体/简体汉字的字符嵌入支持
多任务适用
可微调用于多种下游任务,如句子切分、词性标注等

模型能力

文言文填空
古文句子切分
古文词性标注
古文依存句法分析

使用案例

古文处理
古文填空
填补文言文句子中的缺失部分
如示例所示,能准确预测'孟子见梁惠王'中的'见'字
古文分析
对文言文进行词性标注和句法分析
可识别古文中的词类和语法关系
学术研究
古籍数字化
辅助古籍文献的数字化处理和分析
提高古籍文本处理的效率和准确性