W

Wav2vec2 Large Xlsr Bengali

由 arijitx 开发
基于 facebook/wav2vec2-large-xlsr-53 微调的孟加拉语自动语音识别模型,使用 OpenSLR 数据集中的4万条语音训练
下载量 758
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个专门用于孟加拉语自动语音识别(ASR)的模型,能够将孟加拉语语音转换为文本。

模型特点

高精度孟加拉语识别
专门针对孟加拉语优化的语音识别模型,在测试集上达到32.45%的词错误率
基于XLSR架构
基于facebook的wav2vec2-large-xlsr-53模型微调,利用了跨语言语音表示学习
大规模训练数据
使用OpenSLR数据集中约4万条孟加拉语语音进行训练

模型能力

孟加拉语语音识别
音频转文本
16kHz采样率语音处理

使用案例

语音转写
孟加拉语语音转录
将孟加拉语语音内容转换为文本格式
词错误率32.45%
语音助手
孟加拉语语音交互
为孟加拉语语音助手提供语音识别能力