W

Wav2vec2 Xlsr 1b Finnish

由 aapot 开发
基于Facebook的wav2vec2-xls-r-1b模型针对芬兰语自动语音识别(ASR)进行微调的版本,使用259.57小时芬兰语标注语音数据训练
下载量 18
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对芬兰语优化的自动语音识别模型,适用于将芬兰语语音转换为文本。

模型特点

大规模预训练基础
基于43.6万小时多语言语音数据预训练的wav2vec2-xls-r-1b模型
芬兰语优化
使用259.57小时芬兰语标注数据专门微调
高效训练
使用8-bit Adam优化器和混合精度训练
语言模型支持
提供结合KenLM语言模型的改进版本

模型能力

芬兰语语音识别
短音频转录(最长20秒)
语音转文本

使用案例

语音转录
会议记录转录
将芬兰议会会议等正式场合的语音转换为文本
在议会数据集上表现良好
语音助手
为芬兰语语音助手提供语音识别能力
语音分析
语音内容分析
分析芬兰语广播或播客内容