W

Wav2vec2 Large Xlsr 53 German Cv9

由 oliverguhr 开发
这是一个基于Facebook的wav2vec2-large-xlsr-53模型在德语Common Voice 9.0数据集上微调的自动语音识别(ASR)模型。
下载量 98
发布时间 : 6/13/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于德语语音识别任务,在Common Voice 9.0德语测试集上取得了WER 9.48和CER 1.92的优异表现。

模型特点

高性能德语语音识别
在Common Voice 9.0德语测试集上WER仅为9.48,CER为1.92
基于大规模预训练模型
基于Facebook的wav2vec2-large-xlsr-53模型微调,继承了其强大的语音表示能力
支持语言模型融合
结合语言模型(LM)后,WER可进一步降低至7.49

模型能力

德语语音识别
语音转文本
自动语音转录

使用案例

语音转录
德语语音转录
将德语语音内容转换为文本
WER 9.48, CER 1.92
语音助手
德语语音指令识别
用于德语语音助手中的语音指令识别