W

Wav2vec2 Large Xlsr Open Brazilian Portuguese

由 lgris 开发
这是一个针对巴西葡萄牙语微调的 Wav2vec 2.0 模型,使用了多个开放巴西葡萄牙语数据集进行训练,包括 Common Voice、MLS、CETUC 等。
下载量 395
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个自动语音识别(ASR)模型,专门针对巴西葡萄牙语进行了优化,能够将葡萄牙语语音转换为文本。

模型特点

多数据集训练
结合了多个巴西葡萄牙语数据集(CETUC、MLS、VoxForge、Common Voice 和 Lapsbm)进行训练,提高了模型的泛化能力。
高性能
在 Common Voice 测试集上取得了 12.9% 的词错误率(WER),表现出色。
开放数据
完全基于开放数据集训练,确保了模型的透明性和可重复性。

模型能力

巴西葡萄牙语语音识别
长音频处理
多种口音适应

使用案例

语音转文字
语音转录
将巴西葡萄牙语语音内容转换为文字记录
在标准测试集上达到12.9%的词错误率
辅助技术
语音控制应用
为巴西葡萄牙语用户提供语音控制界面