B

Bert Restore Punctuation

由 felflare 开发
基于bert-base-uncased架构微调的标点恢复模型,专为Yelp评论数据集设计,能预测纯小写文本的标点符号及大小写恢复。
下载量 1,890
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于恢复英文文本中的标点符号和大小写,适用于语音识别输出或其他丢失标点的文本处理。支持恢复的标点包括:! ? . , - : ; ' 以及单词首字母大写。

模型特点

多标点恢复
支持恢复多种标点符号,包括句号、逗号、问号、感叹号等常见标点。
大小写恢复
能够自动恢复单词的首字母大写,提升文本可读性。
长文本处理
支持任意长度的英文文本处理,适合处理长篇内容。
GPU加速
自动启用GPU加速,提高处理速度。

模型能力

标点符号恢复
大小写恢复
文本处理
长文本支持

使用案例

语音识别后处理
ASR输出文本标点恢复
将语音识别系统输出的无标点文本恢复标点和大小写。
提升文本可读性和专业性。
文本预处理
丢失标点文本恢复
处理因传输或存储丢失标点的文本。
恢复原始文本格式,便于后续分析。