P

Punctuation Fullstop Truecase English

由 1-800-BAD-CODE 开发
该模型专为英文文本设计,能够同时完成标点恢复、大小写校正和句子边界检测任务。
下载量 427
发布时间 : 3/11/2023
模型介绍
内容详情
替代品

模型简介

接收无标点的小写英文文本,一次性完成标点恢复、首字母大写和句子分段。支持特殊缩写词和任意大小写形式的单词处理。

模型特点

多任务一体化处理
同时完成标点恢复、大小写校正和句子边界检测三项任务
特殊缩写词处理
通过专用类别预测带标点的缩写(如U.S.)
灵活大小写支持
多标签预测机制支持处理NATO、McDonald's等特殊大小写形式
高效长文本处理
支持自动分段处理超过256子词的文本

模型能力

文本标点恢复
首字母大写校正
句子边界检测
特殊缩写识别
非正式文本处理

使用案例

文本规范化
新闻稿件处理
将无标点的新闻草稿转换为规范格式
标点恢复F1 97.21,大小写校正F1 99.50
对话文本整理
处理聊天记录等非正式文本
支持常见缩写和口语表达
数据预处理
NLP管道预处理
为下游任务准备规范化文本
自动分句准确率99.09