W

Wav2vec2 Large Xlsr Portuguese

由 joaoalvarenga 开发
基于Facebook的wav2vec2-large-xlsr-53架构微调的葡萄牙语自动语音识别模型,在通用语音数据集上训练,词错误率13.77%。
下载量 83
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个专门针对葡萄牙语优化的自动语音识别(ASR)模型,基于大规模自监督预训练的wav2vec2架构,适用于葡萄牙语语音转文本任务。

模型特点

高精度葡萄牙语识别
在通用语音葡萄牙语测试集上达到13.77%的词错误率,表现优异。
基于XLSR架构
利用跨语言语音表示的大规模预训练模型,具有强大的语音特征提取能力。
无需语言模型
可直接使用,不需要额外的语言模型即可实现语音转文本功能。
开源许可
采用Apache-2.0许可证,允许商业和研究用途。

模型能力

葡萄牙语语音识别
音频转文本
语音转录

使用案例

语音转录
葡萄牙语会议记录
自动将葡萄牙语会议录音转换为文字记录
准确率约86.23%
语音助手
为葡萄牙语语音助手提供语音识别能力
教育
语言学习应用
帮助学习者练习葡萄牙语发音和听力