W

Wav2vec2 Xls R 300m Cs 250

由 comodoro 开发
这是一个基于facebook/wav2vec2-xls-r-300m在捷克语数据集上微调的自动语音识别模型,支持16kHz采样率的语音输入。
下载量 248.66k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对捷克语的自动语音识别模型,在Common Voice 8.0等数据集上微调,可直接使用或配合语言模型使用。

模型特点

多数据集训练
使用了Common Voice 8.0、OVM、PSCR和Vystadial2016等多个捷克语数据集进行训练
高性能
在Common Voice 8.0测试集上达到7.3%的词错误率和2.1%的字符错误率
直接使用
无需语言模型即可直接进行语音识别

模型能力

捷克语语音识别
16kHz采样率语音处理
无语言模型直接推理

使用案例

语音转录
语音转文字
将捷克语语音内容转换为文字
词错误率7.3%,字符错误率2.1%
语音分析
语音内容分析
分析捷克语语音内容