P

Punctuate All

由 kredor 开发
基于xlm-roberta-base微调的多语言标点符号预测模型,支持12种欧洲语言的标点符号自动补全
下载量 728.70k
发布时间 : 4/9/2022
模型介绍
内容详情
替代品

模型简介

该模型用于自动预测和补全文本中的标点符号,特别适用于语音转文字后的标点符号恢复场景。相比原版模型,本版本支持更多语言但使用更小的基础模型。

模型特点

多语言支持
支持12种欧洲语言的标点符号预测,比原版模型增加8种语言
高效模型
使用xlm-roberta-base而非large版本,在保持较好性能的同时降低计算资源需求
高准确率
在常见标点符号(如句号、逗号)上达到0.85-0.95的F1分数

模型能力

标点符号自动补全
多语言文本处理
语音转文字后处理

使用案例

语音转录增强
会议记录自动标点
将语音识别输出的无标点文本自动添加标点符号
可准确恢复95%的句号和86%的逗号
文本预处理
机器翻译预处理
为无标点的原始文本添加标点符号以提高翻译质量