W

Wav2vec2 Large Xlsr Catala

由 softcatala 开发
基于facebook/wav2vec2-large-xlsr-53模型微调的加泰罗尼亚语语音识别模型,在通用语音库和议会语音库数据上训练
下载量 64.30k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于加泰罗尼亚语自动语音识别(ASR)的模型,能够将加泰罗尼亚语语音转换为文本。

模型特点

多数据集训练
结合了通用语音库和议会语音库两个数据集进行训练,提高了模型泛化能力
低词错误率
在测试集上达到6.92%的词错误率(WER),表现优异
无需语言模型
可以直接使用,不需要额外的语言模型支持

模型能力

加泰罗尼亚语语音识别
语音转文本

使用案例

语音转录
议会录音转录
将议会会议录音转换为文本记录
在议会语音库测试集上表现良好
有声书转录
将加泰罗尼亚语有声书转换为文本
在《圣乔治传说》有声书上WER为13.23%
语音助手
加泰罗尼亚语语音指令识别
用于支持加泰罗尼亚语的语音助手和智能设备