W

Wav2vec2 Xlsr 1b Finnish Lm V2

由 aapot 开发
基于Facebook的wav2vec2-xls-r-1b模型针对芬兰语自动语音识别任务进行微调的版本,使用275.6小时芬兰语标注语音数据训练
下载量 61
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是用于芬兰语语音转文本的自动语音识别(ASR)模型,包含声学模型和KenLM语言模型,在Common Voice 7.0测试集上达到4.09%的词错误率

模型特点

高性能芬兰语识别
在Common Voice 7.0测试集上达到4.09%的词错误率和0.88%的字符错误率
大规模预训练基础
基于10亿参数的wav2vec2-xls-r-1b模型微调,该模型在43.6万小时多语言数据上预训练
集成语言模型
包含专门针对芬兰语优化的KenLM 5-gram语言模型,显著提升解码效果
多样化训练数据
使用275.6小时芬兰语数据微调,来源包括Common Voice、议会会议、广播等多种场景

模型能力

芬兰语语音识别
短音频转录(最长20秒)
带语言模型的语音解码

使用案例

语音转文字
会议记录转录
将芬兰语会议录音自动转为文字记录
适用于正式场合语音,准确率较高
语音助手
为芬兰语语音助手提供语音识别能力
需注意对非正式口语的适应性
媒体处理
广播内容字幕生成
自动为芬兰语广播节目生成字幕
对标准广播语音效果良好