X

Xls R 300 Sv Cv7

由 patrickvonplaten 开发
这是一个基于facebook/wav2vec2-xls-r-300m在瑞典语Common Voice 7.0数据集上微调的自动语音识别模型
下载量 19
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于瑞典语的自动语音识别任务,在Common Voice 7.0数据集上表现出色

模型特点

高性能瑞典语识别
在Common Voice 7.0测试集上达到15.99%的词错误率(WER)
多数据集验证
除了Common Voice外,还在鲁棒语音事件数据集上进行了验证
基于XLS-R架构
采用facebook的wav2vec2-xls-r-300m作为基础模型

模型能力

瑞典语语音识别
长音频处理(支持分块处理)

使用案例

语音转文字
瑞典语语音转录
将瑞典语语音内容转换为文字
在Common Voice测试集上WER 15.99%
语音分析
语音事件检测
识别和分析语音中的特定事件
在鲁棒语音事件数据集上WER 24.41%