B

Bp Voxforge1 Xlsr

由 lgris 开发
这是一个针对巴西葡萄牙语语音识别任务微调的Wav2Vec2模型,基于VoxForge数据集训练。
下载量 21
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于Facebook的Wav2Vec2架构,专门针对巴西葡萄牙语语音识别任务进行微调。它能够将葡萄牙语语音转换为文本,适用于多种巴西葡萄牙语方言。

模型特点

多数据集评估
模型在多个巴西葡萄牙语数据集上进行了全面评估,包括CETUC、Common Voice等7个不同数据集
语言模型集成
支持与4-gram语言模型结合使用,显著降低词错误率(WER)
轻量级解决方案
基于相对较小的VoxForge数据集(3.9小时)训练,但仍能取得不错的识别效果

模型能力

巴西葡萄牙语语音识别
语音转文本
支持多种巴西方言

使用案例

语音转录
巴西葡萄牙语语音转录
将巴西葡萄牙语语音内容转换为文本
平均词错误率0.584(无语言模型)或0.454(使用4-gram语言模型)
语音助手
巴西葡萄牙语语音指令识别
用于巴西葡萄牙语语音助手的基础识别组件