W

Wav2vec2 Large Xlsr As

由 anuragshas 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型在阿萨姆语上微调的自动语音识别模型,使用Common Voice数据集进行训练。
下载量 30
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型用于阿萨姆语的自动语音识别任务,能够将阿萨姆语语音转换为文本。

模型特点

多语言支持
基于XLSR-53模型,具有跨语言语音识别能力
高适应性
在阿萨姆语上进行了专门微调,适合该语言的语音识别
开源许可
使用Apache 2.0许可证,允许商业和研究使用

模型能力

阿萨姆语语音识别
16kHz音频处理

使用案例

语音转文字
阿萨姆语语音转录
将阿萨姆语语音内容转换为文本
在Common Voice测试集上WER为69.63%