W

Wav2vec2 Large Xlsr 53 Finnish

由 Tommi 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的芬兰语自动语音识别模型,支持16kHz采样率的语音输入。
下载量 28
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对芬兰语优化的自动语音识别(ASR)模型,基于XLSR-53架构,在通用语音库、CSS10和芬兰议会会议记录等数据集上微调而成。

模型特点

多数据集微调
结合了通用语音库、CSS10和芬兰议会会议记录三个数据集进行训练,提高模型适应性
无需语言模型
可直接使用进行语音识别,无需额外语言模型支持
16kHz采样率支持
专为16kHz采样率的语音输入优化

模型能力

芬兰语语音识别
音频转文本
语音内容分析

使用案例

语音转录
会议记录自动转录
将芬兰议会会议等正式场合的语音内容转换为文本
语音笔记转换
将个人语音备忘录转换为可编辑文本
语音助手
芬兰语语音指令识别
为芬兰语语音助手提供核心识别能力