B

Bp Tedx100 Xlsr

由 lgris 开发
基于TEDx葡萄牙语数据集微调的巴西葡萄牙语Wav2vec 2.0语音识别模型
下载量 23
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型使用Wav2vec 2.0架构,在TEDx葡萄牙语多语言数据集上进行微调,专门用于巴西葡萄牙语的自动语音识别任务。

模型特点

多数据集训练
模型在多个葡萄牙语语音数据集上进行评估,包括CETUC、通用语音等
语言模型支持
可结合4-gram语言模型进一步提升识别准确率
高性能
在多个测试集上表现优异,平均词错误率(WER)为0.321

模型能力

巴西葡萄牙语语音识别
音频转文本
支持多种音频格式处理

使用案例

语音转录
演讲内容转录
将TEDx葡萄牙语演讲内容自动转换为文本
词错误率0.222
商业语音转录
商业会议录音转文字
在LaPS BM数据集上词错误率0.169
语音分析
语音内容分析
对葡萄牙语语音内容进行文本分析