roberta-classical-chinese-base-sentence-segmentation开源模型

首页

Roberta Classical Chinese Base Sentence Segmentation

由 KoichiYasuoka 开发

这是一个基于文言文预训练的RoBERTa模型，专门用于句子分割任务，能够自动识别文言文中的句子边界。

序列标注

Transformers

其他开源协议:Apache-2.0 #文言文句子分割 #古汉语处理 #RoBERTa微调

下载量 34

发布时间 : 3/2/2022

模型简介

该模型用于文言文文本的句子分割任务，能够自动识别文言文中的句子边界。每个分割后的句子以标记类别'B'开头，以'E'结尾（单字符句子则使用标记类别'S'）。

模型特点

文言文专用

专门针对文言文预训练和优化，能够准确识别文言文中的句子边界。

基于RoBERTa架构

采用RoBERTa架构，具有强大的上下文理解能力。

标记分类

使用B/E/S标记系统来标识句子边界，适用于复杂的文言文结构。

模型能力

文言文处理

句子分割

文本标记分类

使用案例

古籍数字化

古籍文本自动分段

对古籍文献进行自动句子分割，便于后续分析和处理。

准确识别文言文句子边界

文言文教学

教学材料预处理

自动分割文言文教材中的句子，便于教学使用。

提高教学材料准备效率

属性	详情
语言	文言文
标签	文言文、文言、古汉语、句子切分、标记分类
基础模型	KoichiYasuoka/roberta-classical-chinese-base-char
许可证	apache - 2.0
任务类型	标记分类

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Roberta Classical Chinese Base Sentence Segmentation

模型简介

模型特点

模型能力

使用案例

🚀 roberta-classical-chinese-base-sentence-segmentation

🚀 快速开始

💻 使用示例

基础用法

📚 详细文档

引用信息

📄 许可证

模型信息表格