W

Wav2vec2 Large Xlsr Estonian

由 manandey 开发
基于facebook/wav2vec2-large-xlsr-53在爱沙尼亚语Common Voice数据集上微调的自动语音识别模型
下载量 21
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是一个针对爱沙尼亚语优化的自动语音识别(ASR)模型,基于Wav2Vec2架构,适用于将爱沙尼亚语音频转换为文本。

模型特点

高质量语音识别
在爱沙尼亚语Common Voice测试集上达到37.36%的WER(词错误率)
预训练模型微调
基于facebook/wav2vec2-large-xlsr-53预训练模型进行爱沙尼亚语特定优化
16kHz采样率支持
专门处理16kHz采样率的音频输入,适合常见语音应用场景

模型能力

爱沙尼亚语音频转文本
语音识别
支持批量处理

使用案例

语音转写
爱沙尼亚语语音转录
将爱沙尼亚语的语音内容转换为文本
在Common Voice测试集上词错误率37.36%
语音助手
爱沙尼亚语语音指令识别
用于理解爱沙尼亚语语音命令