W

Wav2vec2 Large Xls R 300m German With Lm

由 mfleck 开发
基于facebook/wav2vec2-xls-r-300m在Common Voice德语数据集上微调的语音识别模型,集成n-gram语言模型,词错误率8.8%
下载量 26
发布时间 : 3/10/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对德语优化的自动语音识别(ASR)系统,适用于将德语语音转换为文本。

模型特点

语言模型增强
集成n-gram语言模型提升识别准确率
高性能
在Common Voice评估集上达到8.8%的词错误率
大规模预训练
基于3亿参数的XLS-R架构微调

模型能力

德语语音识别
长音频处理(支持分块处理)

使用案例

语音转文字
会议记录
将德语会议录音转换为文字记录
高准确率的转录文本
媒体字幕生成
为德语视频内容自动生成字幕
支持5秒音频块处理