W

Wav2vec2 Xlsr 1b Finnish V2

由 aapot 开发
基于facebook/wav2vec2-xls-r-1b微调的芬兰语自动语音识别模型,使用275.6小时芬兰语标注数据训练
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

针对芬兰语优化的语音转文字模型,适用于短音频转录任务

模型特点

大规模预训练基础
基于43.6万小时多语言语音预训练的10亿参数模型微调
高效微调
使用8-bit Adam优化器进行参数高效微调
多源训练数据
融合议会录音、广播、Common Voice等6个芬兰语数据集
低字符错误率
在Common Voice测试集上达到1.65%的字符错误率

模型能力

芬兰语语音识别
短音频转录
语音内容转文字

使用案例

语音转录
会议记录自动化
将芬兰语会议录音转为文字记录
词错误率9.73%(无语言模型)
媒体内容字幕生成
为芬兰语视频/广播节目生成字幕
字符错误率1.65%
语音助手
芬兰语语音指令识别
支持芬兰语智能设备的语音交互