W

Wav2vec2 Xls R 300m Bangla Command Word Combination Synthetic

由 sshasnain 开发
基于facebook/wav2vec2-xls-r-300m微调的孟加拉语语音识别模型,专注于指令词识别
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对孟加拉语指令词优化的语音识别模型,基于wav2vec2-xls-r-300m架构微调,适用于特定领域的语音指令识别任务

模型特点

孟加拉语优化
专门针对孟加拉语语音识别进行优化,特别是指令词识别场景
合成数据训练
使用合成语音数据进行训练,增强模型对特定指令词的识别能力
高效识别
在保持模型规模适中的情况下(300M参数),实现较好的识别准确率

模型能力

孟加拉语语音识别
指令词识别
语音转文本

使用案例

智能家居控制
孟加拉语语音控制
用于识别孟加拉语智能家居控制指令
词错误率0.4111
语音助手
本地化语音交互
为孟加拉语用户提供本地化的语音交互体验