W

Wav2vec2 Xlsr 300m Finnish

由 aapot 开发
基于facebook/wav2vec2-xls-r-300m针对芬兰语自动语音识别任务微调的声学模型,使用275.6小时芬兰语标注语音数据训练
下载量 96
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型适用于芬兰语语音转文本任务,是Wav2Vec2 XLS-R预训练模型的微调版本,支持芬兰语自动语音识别。

模型特点

多语言预训练基础
基于支持128种语言的Wav2Vec2 XLS-R预训练模型微调,具有强大的语音表示能力
高效微调
使用275.6小时芬兰语标注数据进行针对性微调,优化芬兰语识别效果
支持语言模型增强
可结合KenLM语言模型进一步提升转录准确率

模型能力

芬兰语语音识别
短音频转录(最长20秒)
语音转文本

使用案例

语音转录
议会会议记录
转录芬兰议会会议音频内容
在议会数据集上表现良好
日常语音转写
将芬兰语日常对话转换为文本
对标准发音效果较好,方言识别有限