W

Wav2vec2 Large Xlsr 53 Finnish

由 vasilis 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的芬兰语自动语音识别模型,支持16kHz采样率的语音输入
下载量 27
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Wav2Vec2架构的芬兰语自动语音识别(ASR)模型,使用Common Voice和CSS10芬兰语数据集进行微调,可直接用于语音转文本任务

模型特点

多数据集微调
同时使用Common Voice和CSS10芬兰语数据集进行训练,提高模型适应性
无需语言模型
可直接使用,不需要额外的语言模型支持
16kHz采样率支持
专门优化支持16kHz采样率的语音输入

模型能力

芬兰语语音识别
语音转文本
自动语音转录

使用案例

语音转录
芬兰语语音转文本
将芬兰语语音内容转换为文本格式
测试WER 38.34%,CER 6.55%
语音助手
芬兰语语音指令识别
用于芬兰语语音助手或智能家居系统的语音指令识别