W

Wav2vec2 Large Xlsr 53 Polish

由 facebook 开发
Facebook开发的波兰语自动语音识别模型,基于Wav2Vec2架构和XLSR-53多语言预训练模型
下载量 174
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对波兰语优化的自动语音识别模型,基于大规模自监督学习预训练,适用于语音转文本任务

模型特点

多语言预训练基础
基于XLSR-53多语言模型微调,具有强大的跨语言表示能力
高精度波兰语识别
专门针对波兰语优化,在Common Voice测试集上达到24.6%词错率
端到端语音识别
直接从原始音频输入生成文本输出,无需传统ASR系统的复杂组件

模型能力

波兰语语音识别
音频转文本
语音内容转录

使用案例

语音转录
语音备忘录转录
将波兰语语音备忘录自动转换为可搜索的文本
24.6%词错率(在Common Voice测试集上)
客服电话记录
自动转录波兰语客服通话内容用于后续分析
辅助技术
语音控制应用
为波兰语用户提供语音控制界面