W

Wav2vec2 Large Xlsr Welsh

由 Srulikbdd 开发
基于facebook/wav2vec2-large-xlsr-53在威尔士语Common Voice数据集上微调的自动语音识别模型,测试WER为29.4%。
下载量 386
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对威尔士语的自动语音识别系统,采用Wav2Vec2架构,适用于将威尔士语音频转换为文本。

模型特点

高效语音识别
针对威尔士语优化的语音识别能力,测试WER达到29.4%
基于XLSR预训练模型
基于facebook/wav2vec2-large-xlsr-53模型微调,具备强大的语音特征提取能力
无需语言模型
可直接使用,无需额外语言模型支持

模型能力

威尔士语语音识别
音频转文本
16kHz采样率音频处理

使用案例

语音转录
威尔士语语音转录
将威尔士语音频内容转换为文本
测试WER 29.4%
语音助手
威尔士语语音指令识别
用于支持威尔士语的语音助手系统