W

Wav2vec2 Xls R 1b Polish

由 jonatasgrosman 开发
这是一个基于XLS-R 10亿参数模型微调的波兰语自动语音识别(ASR)模型,在Common Voice 8.0等数据集上训练,支持16kHz采样率的语音输入。
下载量 212
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对波兰语优化的自动语音识别系统,基于Facebook的XLS-R 10亿参数模型微调而成,在波兰语语音识别任务上表现出色。

模型特点

高性能波兰语识别
在Common Voice 8.0测试集上达到11.01%的WER和2.55%的CER
支持语言模型增强
结合语言模型后,WER可降至7.32%,CER降至1.95%
大规模预训练基础
基于XLS-R 10亿参数模型微调,具备强大的语音特征提取能力
多数据集训练
使用Common Voice 8.0、Multilingual LibriSpeech和Voxpopuli数据集训练

模型能力

波兰语语音识别
16kHz音频处理
批量语音转录

使用案例

语音转录
语音转文字服务
将波兰语语音内容转换为文字
在标准测试集上达到92.68%的准确率(使用语言模型)
语音助手
波兰语语音指令识别
用于语音控制设备和应用程序