W

Wav2vec2 Large Xls R 300m Bn Colab

由 rhr99 开发
该模型是基于facebook/wav2vec2-xls-r-300m在common_voice_9_0数据集上微调的语音识别模型,支持孟加拉语。
下载量 18
发布时间 : 6/23/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对孟加拉语优化的语音识别模型,基于wav2vec2-xls-r-300m架构微调而成,适用于语音转文本任务。

模型特点

基于大规模预训练模型微调
在facebook/wav2vec2-xls-r-300m基础上针对孟加拉语进行优化
多语言支持
专注于孟加拉语语音识别,可能保留原模型的多语言能力
高效训练
使用混合精度训练和梯度累积等技术优化训练效率

模型能力

语音识别
音频转文本
孟加拉语处理

使用案例

语音转录
孟加拉语语音转文字
将孟加拉语语音内容转换为文本
词错误率(WER)0.9861
语音助手
孟加拉语语音指令识别
用于理解孟加拉语语音命令