W

Wav2vec2 Xls R 300m Ftspeech

由 saattrupdan 开发
基于facebook/wav2vec2-xls-r-300m在丹麦议会语音数据集上微调的丹麦语自动语音识别模型
下载量 1.3M
发布时间 : 3/4/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于丹麦语自动语音识别(ASR)的模型,基于wav2vec2-xls-r-300m架构,在1,800小时的丹麦议会演讲数据上进行了微调。

模型特点

丹麦语优化
专门针对丹麦语语音识别进行了优化,在丹麦议会语音数据集上进行了微调
高性能
在Common Voice 8.0丹麦语部分和Alvenir测试集上取得了较低的词错误率
支持语言模型
支持使用5-gram语言模型进一步提升识别准确率

模型能力

丹麦语语音识别
语音转文本
支持5-gram语言模型增强

使用案例

语音转录
议会演讲转录
将丹麦议会演讲内容自动转录为文本
在议会数据集上训练,适合此类内容识别
通用语音识别
日常语音转录
将丹麦语日常对话转换为文本
在Common Voice数据集上WER为17.91