B

Bp500 Base10k Voxpopuli

由 lgris 开发
这是一个针对巴西葡萄牙语优化的Wav2vec 2.0语音识别模型,基于多个巴西葡萄牙语数据集微调
下载量 23
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Wav2vec 2.0架构的自动语音识别(ASR)系统,专门针对巴西葡萄牙语优化,在多个巴西葡萄牙语数据集上表现出色

模型特点

多数据集训练
融合了CETUC、Common Voice、LaPS BM等多个巴西葡萄牙语数据集,总计超过450小时训练数据
语言模型支持
可结合4-gram语言模型进一步提升识别准确率
广泛测试验证
在7个不同测试集上进行了全面评估,平均WER为18.1%

模型能力

巴西葡萄牙语语音识别
语音转文本
支持16kHz采样率音频处理

使用案例

语音转录
巴西葡萄牙语语音转录
将巴西葡萄牙语语音转换为文本
在CETUC测试集上WER为12.0%,结合语言模型后可降至7.5%
语音助手
巴西葡萄牙语语音指令识别
用于巴西葡萄牙语语音助手或智能家居设备的语音指令识别