W

Wav2vec2 Base Fi Voxpopuli V2 Finetuned

由 Finnish-NLP 开发
基于facebook/wav2vec2-base-fi-voxpopuli-v2微调的芬兰语自动语音识别模型,使用276.7小时标注数据训练,支持KenLM语言模型解码
下载量 64
发布时间 : 5/14/2022
模型介绍
内容详情
替代品

模型简介

针对芬兰语优化的语音转文字模型,在Common Voice等测试集上表现优异

模型特点

高效微调
基于VoxPopuli V2预训练模型,使用276.7小时芬兰语数据微调
多数据集支持
融合Common Voice、议会会议、广播语料库等6种数据源
语言模型增强
配套芬兰语KenLM 5-gram语言模型提升识别准确率
轻量级部署
支持8-bit Adam优化器,适合资源受限环境

模型能力

芬兰语语音转文字
短音频转录(≤20秒)
带语言模型的语音识别

使用案例

语音转录
会议记录自动化
将芬兰议会会议录音转为文字记录
在议会数据集上WER 5.93%
语音助手开发
为芬兰语智能设备提供语音交互基础
在Common Voice 9.0上CER 1.40%
教育科技
语言学习工具
用于芬兰语发音评估系统