W

Wav2vec2 Large Xlsr Polish

由 mbien 开发
基于facebook/wav2vec2-large-xlsr-53在Common Voice波兰语数据集上微调的语音识别模型,测试集词错误率23.01%
下载量 40
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对波兰语优化的自动语音识别(ASR)模型,能够将波兰语语音转换为文本。

模型特点

高精度波兰语识别
在Common Voice波兰语测试集上达到23.01%的词错误率
无需语言模型
可直接使用,不需要额外的语言模型支持
基于XLSR架构
使用facebook的wav2vec2-large-xlsr-53作为基础模型,具有强大的语音特征提取能力

模型能力

波兰语语音识别
音频转文本
16kHz音频处理

使用案例

语音转写
波兰语语音转录
将波兰语语音内容转换为可编辑的文本格式
词错误率23.01%
语音助手
波兰语语音指令识别
用于构建波兰语语音助手或语音控制系统