W

Wav2vec2 Large Xls R 300m Pt Colab

由 robertodtg 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_9_0数据集上微调的语音识别模型,支持葡萄牙语语音转文本任务。
下载量 107
发布时间 : 6/24/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对葡萄牙语优化的语音识别模型,基于wav2vec2-xls-r-300m架构微调,在Common Voice 9.0数据集上训练,适用于葡萄牙语语音转文本任务。

模型特点

葡萄牙语优化
专门针对葡萄牙语语音识别任务进行微调优化
基于大规模预训练模型
基于facebook/wav2vec2-xls-r-300m预训练模型,具有强大的语音特征提取能力
相对轻量级
300M参数规模,在保持性能的同时相对轻量

模型能力

葡萄牙语语音识别
语音转文本
自动语音识别

使用案例

语音转录
葡萄牙语语音转录
将葡萄牙语语音内容转换为文本
在评估集上取得17.36%的词错误率
语音助手
葡萄牙语语音指令识别
用于构建葡萄牙语语音助手或语音控制应用