W

Wav2vec2 Xlsr 1b Finnish Lm V2

由 Finnish-NLP 开发
针对芬兰语优化的自动语音识别模型,基于Facebook的wav2vec2-xls-r-1b模型微调
下载量 3,869
发布时间 : 3/27/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对芬兰语自动语音识别(ASR)任务优化的声学模型,使用275.6小时的芬兰语标注语音数据微调,并包含芬兰语KenLM语言模型用于解码

模型特点

高性能芬兰语识别
在Common Voice 7测试集上达到4.09% WER和0.88% CER的优异表现
大规模预训练基础
基于在43.6万小时多语言数据上预训练的wav2vec2-xls-r-1b模型
集成语言模型
包含专门针对芬兰语优化的5-gram KenLM语言模型,提升解码效果
多数据集训练
融合了Common Voice、芬兰议会、VoxPopuli等多个芬兰语语音数据集

模型能力

芬兰语语音转文本
短音频处理(最长20秒)
支持语音识别任务

使用案例

语音转录
议会会议记录
将芬兰议会会议录音转为文字记录
适合正式场合的芬兰语语音
语音助手
为芬兰语语音助手提供ASR能力
对标准芬兰语有良好识别率
语音分析
语音内容分析
分析芬兰语广播或播客内容
适合正式媒体内容的语音识别