W

Wav2vec2 Large Xlsr Estonian

由 m3hrdadfi 开发
这是一个基于facebook/wav2vec2-large-xlsr-53模型微调的爱沙尼亚语自动语音识别(ASR)模型,使用Common Voice数据集进行训练。
下载量 26
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专门用于爱沙尼亚语的语音识别任务,能够将爱沙尼亚语音频转换为文本。

模型特点

高精度语音识别
在Common Voice爱沙尼亚语测试集上达到33.93%的WER(词错误率)
基于XLSR预训练模型
使用facebook/wav2vec2-large-xlsr-53作为基础模型进行微调
16kHz音频支持
模型处理16kHz采样率的音频输入

模型能力

爱沙尼亚语音频转文本
自动语音识别

使用案例

语音转录
语音转文字服务
将爱沙尼亚语的语音内容转换为可编辑的文本
词错误率33.93%
语音助手
爱沙尼亚语语音指令识别
用于构建支持爱沙尼亚语的语音助手系统