W

Wav2vec2 Large Xlsr 53 German

由 facebook 开发
基于Facebook的Wav2Vec2架构的大规模德语自动语音识别(ASR)模型,在Common Voice德语数据集上微调
下载量 1,767
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Wav2Vec2架构的预训练模型,专门针对德语语音识别任务进行了微调,能够将德语语音转换为文本。

模型特点

大规模预训练
基于XLSR-53多语言模型进行预训练,具有强大的语音特征提取能力
德语优化
专门针对德语语音特点进行了微调,适应德语的发音和语法特征
高准确率
在Common Voice德语测试集上达到18.5%的词错误率(WER)

模型能力

德语语音识别
语音转文本
音频内容转录

使用案例

语音转录
德语语音转文字
将德语语音内容自动转换为文本格式
词错误率18.5%(在Common Voice测试集上)
辅助技术
语音控制应用
为德语用户提供语音控制界面