W

Wav2vec2 Large Xlsr Or

由 danurahul 开发
基于Facebook的wav2vec2-large-xlsr-53模型在Odia语言上微调的自动语音识别模型
下载量 22
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是专门为Odia语言优化的自动语音识别(ASR)系统,基于Common Voice数据集微调,适用于16kHz采样率的语音输入。

模型特点

多语言预训练基础
基于Facebook的多语言wav2vec2-large-xlsr-53模型微调,具有强大的语音特征提取能力
低资源语言优化
专门针对Odia这种资源相对较少的语言进行优化
端到端语音识别
无需语言模型即可直接进行语音到文本转换

模型能力

语音识别
音频转文本
Odia语音处理

使用案例

语音转录
Odia语音转录
将Odia语音内容转换为文本
在Common Voice测试集上达到54.6% WER
语音助手
Odia语音助手
支持Odia语言的语音交互系统