W

Wav2vec2 Large Xlrs Estonian

由 birgermoell 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型在爱沙尼亚语通用语音数据集上微调的自动语音识别(ASR)模型。
下载量 18
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于爱沙尼亚语的语音识别任务,基于Wav2Vec2架构,在通用语音数据集上进行了微调。

模型特点

XLSR微调
基于大规模多语言预训练模型XLSR-53在爱沙尼亚语上进行微调
16kHz采样率支持
专门处理16kHz采样率的语音输入
无需语言模型
可直接使用,无需额外的语言模型

模型能力

爱沙尼亚语语音识别
音频转文本

使用案例

语音转录
爱沙尼亚语语音转文本
将爱沙尼亚语语音转换为文本内容
WER 36.95%