W

Wav2vec2 Xls R 300m Bangla Command Generated Data Finetune

由 hrdipto 开发
基于wav2vec2-xls-r-300m架构的孟加拉语语音识别模型,针对命令识别任务进行了微调
下载量 24
发布时间 : 3/2/2022

模型简介

该模型是在hrdipto/wav2vec2-xls-r-300m-bangla-command-data基础上进行微调的版本,专门用于孟加拉语命令识别任务

模型特点

高效语音识别
针对孟加拉语命令识别进行了优化,评估词错误率仅为0.0208
快速推理
评估时每秒可处理75.217个样本,适合实时应用场景
迁移学习
基于预训练的wav2vec2-xls-r-300m模型进行微调,充分利用预训练知识

模型能力

孟加拉语语音识别
命令词识别
实时语音处理

使用案例

智能家居控制
语音控制设备
通过孟加拉语语音命令控制智能家居设备
高准确率的命令识别
语音助手
本地化语音交互
为孟加拉语用户提供语音交互功能
低延迟的语音识别
AIbase
智启未来,您的人工智能解决方案智库
简体中文