W

Wav2vec2 Xlsr 300m Finnish Lm

由 Finnish-NLP 开发
基于facebook/wav2vec2-xls-r-300m微调的芬兰语自动语音识别模型,使用275.6小时芬兰语标注数据训练,支持与KenLM语言模型配合使用。
下载量 28.39k
发布时间 : 3/28/2022
模型介绍
内容详情
替代品

模型简介

针对芬兰语优化的自动语音识别模型,适用于将芬兰语语音转换为文本的任务。

模型特点

多源训练数据
整合了Common Voice、议会录音、广播语料等275.6小时芬兰语数据,覆盖多种语音场景。
语言模型增强
配套提供基于音频文本和维基百科训练的芬兰语KenLM 5-gram语言模型,提升识别准确率。
高效训练
采用8-bit Adam优化器和混合精度训练,在V100 GPU上完成微调。

模型能力

芬兰语语音识别
长音频分块处理
领域自适应(需微调)

使用案例

语音转写
议会录音转录
适用于芬兰议会录音内容的自动文字转写
在议会数据为主的测试集上WER 8.16%
广播内容字幕生成
为芬兰语广播节目自动生成字幕
在广播语料测试集上CER 1.97%
教育科技
语言学习辅助
用于芬兰语学习者的发音评估和文本反馈