W

Wav2vec2 Large Xls R 300m Marathi Cv8

由 infinitejoy 开发
这是一个基于Facebook的wav2vec2-xls-r-300m模型在马拉地语(Marathi)语音数据集上微调的自动语音识别(ASR)模型。
下载量 443
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于马拉地语的语音识别任务,在Common Voice 8数据集上进行了微调,能够将马拉地语语音转换为文本。

模型特点

多语言支持
基于XLS-R架构,具有处理多种语言的能力,本版本专门针对马拉地语优化
高效训练
使用混合精度训练和Adam优化器,训练效率高
鲁棒性
针对对话场景和不同语音事件进行了优化

模型能力

马拉地语语音识别
语音转文本
处理对话语音

使用案例

语音转录
马拉地语语音转录
将马拉地语语音内容转换为文本
词错误率(WER)55.716,字符错误率(CER)13.842
语音助手
马拉地语语音指令识别
用于构建支持马拉地语的语音助手