Z

Zh Wiki Punctuation Restore

由 p208p2002 开发
一个用于中文维基百科文本的标点符号恢复工具,支持恢复6种常见标点符号。
下载量 102.99k
发布时间 : 1/31/2023
模型介绍
内容详情
替代品

模型简介

该模型专门设计用于中文维基百科文本的标点符号恢复,能够自动为无标点的中文文本添加逗号、顿号、句号、问号、感叹号和分号。

模型特点

多标点支持
支持恢复6种常见中文标点符号:逗号、顿号、句号、问号、感叹号和分号
维基百科优化
专门针对中文维基百科文本进行优化,恢复效果更准确
滑动窗口处理
采用滑动窗口技术处理长文本,确保长文档也能准确恢复标点

模型能力

中文标点恢复
文本规范化
长文本处理

使用案例

文本处理
维基百科文本规范化
为无标点的维基百科文本添加标点符号
使文本更易读,符合出版标准
OCR后处理
处理OCR识别后丢失标点的中文文本
提高OCR文本的可读性
数据预处理
NLP任务预处理
为下游NLP任务准备规范化文本
提高后续NLP任务的处理效果