W

Wav2vec2 Large Xlsr 53 Portuguese

由 facebook 开发
Facebook开发的基于Wav2Vec 2.0架构的大规模葡萄牙语自动语音识别(ASR)模型,支持葡萄牙语语音转文本任务。
下载量 425
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Wav2Vec 2.0架构训练的大规模跨语言语音表示模型(XLSR),专门针对葡萄牙语进行了优化,能够将葡萄牙语语音准确转换为文本。

模型特点

跨语言语音表示
基于XLSR-53架构,能够学习跨语言的通用语音特征表示
葡萄牙语优化
专门针对葡萄牙语语音特点进行了优化训练
端到端识别
直接从原始音频输入生成文本输出,无需中间特征提取步骤

模型能力

葡萄牙语语音识别
语音转文本
自动语音转录

使用案例

语音转录
葡萄牙语语音转文字
将葡萄牙语语音内容自动转换为可编辑的文本格式
在Common Voice葡萄牙语测试集上WER为27.1%
语音助手
葡萄牙语语音指令识别
用于构建葡萄牙语语音助手和语音控制应用