F

Fullstop Punctuation Multilingual Sonar Base

由 oliverguhr 开发
该模型用于预测英语、意大利语、法语、德语和荷兰语文本的标点符号,特别适用于恢复转录口语的标点符号。
下载量 6,181
发布时间 : 5/17/2022
模型介绍
内容详情
替代品

模型简介

基于Transformer架构的多语言标点符号预测模型,能够恢复句号、逗号、问号、连字符和冒号等标点符号。

模型特点

多语言支持
支持英语、德语、法语、意大利语和荷兰语五种语言的标点预测。
高精度预测
在多种标点符号预测任务上表现优异,特别是句号和问号的预测准确率较高。
政治演讲优化
模型基于欧洲议会数据集训练,特别适合处理政治演讲类文本。

模型能力

文本标点恢复
多语言文本处理
标点符号预测

使用案例

语音转录
会议记录标点恢复
为没有标点的会议转录文本添加标点符号
F1分数达到0.784(宏平均)
教育
语言学习辅助
帮助语言学习者理解标点符号的正确使用