W

Wav2vec2 Xlsr 300m Finnish Lm

由 aapot 开发
基于Facebook wav2vec2-xls-r-300m模型微调的芬兰语自动语音识别(ASR)模型,使用275.6小时芬兰语数据训练,支持与KenLM语言模型配合解码
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

针对芬兰语优化的语音转文本模型,适用于芬兰语语音识别任务

模型特点

多语言预训练基础
基于支持128种语言的wav2vec2-xls-r-300m模型微调
语言模型增强
包含专门训练的芬兰语KenLM 5-gram语言模型提升识别准确率
高效训练
使用8-bit Adam优化器和混合精度训练技术
全面数据覆盖
训练数据包含议会记录、广播、Common Voice等多来源芬兰语数据

模型能力

芬兰语语音识别
长音频分块处理
带语言模型的解码

使用案例

语音转录
议会会议记录
将芬兰议会会议音频转为文字记录
对正式演讲风格识别效果最佳
广播内容转录
芬兰语广播节目的文字转录
语音助手
芬兰语语音指令识别
用于芬兰语智能设备的语音控制