W

Wav2vec2 Xlsr 1b Finnish Lm

由 Finnish-NLP 开发
基于facebook/wav2vec2-xls-r-1b微调的芬兰语自动语音识别模型,使用259.57小时芬兰语标注语音数据训练,支持芬兰语语音转文本任务。
下载量 32
发布时间 : 3/28/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对芬兰语优化的自动语音识别模型,基于10亿参数的Wav2Vec2 XLS-R架构微调,适用于短音频转录。包含配套的芬兰语KenLM语言模型以提升解码效果。

模型特点

大规模预训练基础
基于43.6万小时多语言语音预训练的XLS-R架构,具有强大的声学特征提取能力
领域适配微调
使用259小时芬兰语数据微调,特别优化议会演讲和广播语音场景
语言模型增强
配套5-gram KenLM语言模型,显著提升转录准确率
高效推理
支持20秒短音频直接处理,长音频可通过分块方法处理

模型能力

芬兰语语音识别
短音频转录
带语言模型的解码

使用案例

语音转录
议会会议记录
转录芬兰议会演讲内容
在阿尔托议会数据集上表现优异
广播内容转写
处理芬兰广播电台节目音频
在广播语料库上WER 5.65%
教育应用
语言学习辅助
帮助学习者纠正芬兰语发音