W

Wav2vec2 Large Xlsr Malayalam

由 gvs 开发
基于facebook/wav2vec2-large-xlsr-53在马拉雅拉姆语上微调的语音识别模型,支持16kHz采样率的语音输入。
下载量 29.57k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对马拉雅拉姆语优化的自动语音识别模型,基于XLSR-53架构微调,适用于马拉雅拉姆语语音转文本任务。

模型特点

多数据集训练
使用了四个不同的马拉雅拉姆语语音数据集进行训练,提高了模型的泛化能力。
低词错误率
在组合测试集上达到28.43%的词错误率,表现良好。
即用型模型
无需额外语言模型即可直接使用,简化了部署流程。

模型能力

马拉雅拉姆语语音识别
16kHz语音处理
自动语音转文本

使用案例

语音转写
马拉雅拉姆语语音转录
将马拉雅拉姆语语音内容转换为文本
28.43%词错误率
语音助手
本地化语音交互
为马拉雅拉姆语用户提供语音交互支持