W

Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Portuguese

由 Edresson 开发
这是一个基于 Facebook 的 Wav2vec2 Large 100k Voxpopuli 模型,使用 Common Voice 7.0 和 TTS-葡萄牙语语料库在葡萄牙语上进行微调的自动语音识别模型。
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于葡萄牙语的自动语音识别任务,能够将葡萄牙语语音转换为文本。

模型特点

葡萄牙语优化
专门针对葡萄牙语语音进行微调,提高了识别准确率。
多数据集训练
结合 Common Voice 和 TTS-葡萄牙语语料库进行训练,增强了模型的泛化能力。
高性能
在 Common Voice 7.0 测试集上达到 20.39% 的词错误率。

模型能力

葡萄牙语语音识别
音频转文本
自动语音识别

使用案例

语音转写
葡萄牙语语音转文本
将葡萄牙语语音内容自动转换为文本格式
词错误率 20.39%
语音助手
葡萄牙语语音命令识别
用于开发葡萄牙语语音助手和控制系统