B

Bp400 Xlsr

由 lgris 开发
基于巴西葡萄牙语数据集微调的Wav2vec 2.0语音识别模型,支持巴西葡萄牙语自动语音识别任务。
下载量 55
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对巴西葡萄牙语优化的自动语音识别(ASR)系统,基于Wav2vec 2.0架构,在多个巴西葡萄牙语数据集上进行了微调。

模型特点

多数据集训练
模型融合了7个巴西葡萄牙语数据集,包括CETUC、Common Voice等,总计超过400小时的训练数据。
语言模型支持
可结合4-gram语言模型进一步提升识别准确率,平均WER从12.4%降至10.5%。
高准确率
在多个测试集上表现优异,CETUC测试集WER低至3.0%,Common Voice测试集WER为9.6%。

模型能力

巴西葡萄牙语语音识别
音频转录
语音转文本

使用案例

语音转录
巴西葡萄牙语语音转录
将巴西葡萄牙语语音内容转换为文本
在CETUC数据集上达到3.0% WER的高准确率
语音助手
巴西葡萄牙语语音指令识别
用于巴西葡萄牙语语音助手系统中的指令识别