X

Xlsr En Punctuation

由 boris 开发
基于facebook/wav2vec2-large-xlsr-53在英语通用语音数据集上微调的自动语音识别模型,支持标点预测
下载量 30.28k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于英语自动语音识别(ASR)的Wav2Vec2模型,能够将语音转换为文本并自动添加标点符号。

模型特点

多语言预训练
基于XLSR-53多语言模型微调,具有强大的跨语言表示能力
标点预测
不仅能识别语音内容,还能自动预测并添加标点符号
高准确率
在通用语音英语测试集上达到1.0%的词错误率(WER)

模型能力

英语语音识别
自动标点预测
16kHz音频处理

使用案例

语音转录
会议记录自动生成
将会议录音自动转换为带标点的文字记录
准确率高,减少人工校对工作量
播客字幕生成
为英语播客自动生成带标点的字幕文件
支持SRT等常见字幕格式输出
辅助技术
语音输入系统
为残障人士提供高精度的语音输入解决方案
提高输入效率和准确性