W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Portuguese

由 Edresson 开发
这是一个基于Facebook的Wav2vec2 Large 100k Voxpopuli模型,使用Common Voice 7.0和TTS葡萄牙语数据集进行微调,并应用了数据增强技术的葡萄牙语语音识别模型。
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专注于葡萄牙语语音识别任务,通过数据增强和额外TTS数据集微调提高了识别准确率。

模型特点

数据增强微调
使用TTS生成数据和语音转换技术进行数据增强,提高了模型性能
多数据集训练
结合Common Voice 7.0和专门TTS葡萄牙语数据集进行训练
高性能识别
在Common Voice 7.0测试集上达到20.20%的词错误率

模型能力

葡萄牙语语音识别
音频转文本
自动语音识别

使用案例

语音转录
葡萄牙语语音转文字
将葡萄牙语语音内容转换为文字
词错误率20.20%
语音助手
葡萄牙语语音指令识别
用于葡萄牙语语音助手系统的语音指令识别