W

Wav2vec2 Xlsr 1b Finnish Lm

由 aapot 开发
基于Facebook的wav2vec2-xls-r-1b模型微调的芬兰语自动语音识别(ASR)模型,使用259.57小时芬兰语标注数据训练
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对芬兰语优化的语音转文本模型,采用10亿参数规模的XLS-R架构,配合KenLM语言模型提升识别准确率

模型特点

大规模预训练基础
基于43.6万小时多语言语音数据预训练的XLS-R架构
高精度芬兰语识别
在Common Voice测试集上达到5.65% WER和1.2% CER
语言模型增强
包含专门训练的芬兰语KenLM 5-gram语言模型
高效训练
使用8-bit Adam优化器和混合精度训练技术

模型能力

芬兰语语音转文本
短音频转录(≤20秒)
配合语言模型提升识别准确率

使用案例

语音转录
会议记录转写
将芬兰语会议录音转换为文字记录
适合议会演讲等正式场合
语音助手
为芬兰语语音交互系统提供ASR支持