W

Wav2vec2 Large Xlsr 53 Polish

由 jonatasgrosman 开发
针对波兰语优化的XLSR-53大模型语音识别系统,基于facebook/wav2vec2-large-xlsr-53微调,支持波兰语自动语音识别
下载量 412.13k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个基于XLSR-53架构的波兰语语音识别模型,使用Common Voice 6.1波兰语数据集微调,适用于波兰语语音转文本任务。

模型特点

波兰语优化
专门针对波兰语进行微调,在Common Voice波兰语测试集上取得14.21%的词错误率
支持语言模型集成
可结合语言模型进一步提升识别准确率,词错误率可降至10.98%
鲁棒语音处理
在鲁棒语音事件数据集上表现良好,能够处理不同环境下的语音输入

模型能力

波兰语语音识别
音频转文本
支持16kHz采样率音频处理

使用案例

语音转写
波兰语语音转录
将波兰语语音内容转换为文本
在Common Voice测试集上词错误率14.21%,字符错误率3.49%
语音助手
波兰语语音指令识别
识别和理解波兰语语音指令