R

Rut5 ASR Large

由 bond005 开发
基于ruT5-large架构的俄语ASR输出校正模型,用于纠正语音识别错误、恢复标点及大小写
下载量 266
发布时间 : 6/22/2023
模型介绍
内容详情
替代品

模型简介

该模型专门用于自动语音识别(ASR)输出的后处理,可纠正识别错误、恢复标点符号和大小写格式,特别针对Wav2Vec2-Large-Ru-Golos的输出优化

模型特点

ASR输出增强
针对俄语语音识别结果进行智能校正,提升文本可读性
标点符号恢复
自动补全句子标点符号,包括句号、逗号等基本标点
大小写规范化
自动修正专有名词和句子开头的大小写格式
基于T5架构
利用ruT5-large的强大序列转换能力进行文本重构

模型能力

语音识别后处理
文本错误纠正
标点符号恢复
大小写规范化
俄语文本重构

使用案例

语音识别增强
ASR输出校正
修正Wav2Vec2等ASR系统输出的识别错误
示例显示能修正语义错误并添加缺失标点
会议记录处理
对语音转文字结果进行自动化后处理
提升转录文本的可读性和专业性
文本规范化
音频转录后处理
为语音识别生成的原始文本添加标点和正确大小写
输出符合出版标准的格式化文本