B

Bp500 Xlsr

由 lgris 开发
这是一个针对巴西葡萄牙语微调的Wav2vec 2.0模型,使用了多个巴西葡萄牙语数据集进行训练,在Common Voice测试集上WER为13.6。
下载量 21
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Wav2vec 2.0架构的自动语音识别(ASR)模型,专门针对巴西葡萄牙语进行了优化。它整合了多个巴西葡萄牙语数据集,包括CETUC、Common Voice、LaPS BM等,总训练数据量超过400小时。

模型特点

多数据集训练
整合了7个不同的巴西葡萄牙语数据集,总训练时长超过400小时
语言模型支持
支持与4-gram语言模型结合使用,可进一步提升识别准确率
低WER
在多个测试集上表现优异,平均WER为10.8%

模型能力

巴西葡萄牙语语音识别
支持多种音频采样率
可结合语言模型提升性能

使用案例

语音转文字
语音转录
将巴西葡萄牙语语音内容转换为文字
在Common Voice测试集上WER为13.6%
语音助手
巴西葡萄牙语语音指令识别
用于巴西葡萄牙语语音助手的前端语音识别