W

Wav2vec2 Xls R 1b Ca Lm

由 PereLluis13 开发
这是一个基于facebook/wav2vec2-xls-r-300m微调的加泰罗尼亚语语音识别模型,在多个加泰罗尼亚语数据集上训练。
下载量 3,758
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对加泰罗尼亚语的自动语音识别(ASR)模型,在Common Voice 8.0、tv3_parla和parlament_parla数据集上进行了微调。

模型特点

多数据集训练
在Common Voice 8.0、tv3_parla和parlament_parla三个加泰罗尼亚语数据集上训练,提高了模型鲁棒性
数据预处理优化
移除了加泰罗尼亚字母表中不存在的字符,并将数字转换为文字形式,提高了识别准确率
高性能表现
在多个测试集上表现出色,如Common Voice 8.0测试集WER仅6.07%

模型能力

加泰罗尼亚语语音识别
高准确率转录
多领域语音处理

使用案例

媒体转录
电视节目字幕生成
为加泰罗尼亚语电视节目自动生成字幕
在tv3_parla测试集上WER为11.21%
会议记录
议会会议记录
自动转录加泰罗尼亚议会会议内容
在parlament_parla测试集上WER为5.14%
语音助手
加泰罗尼亚语语音输入
为加泰罗尼亚语语音助手提供语音识别能力
在Common Voice测试集上WER为6.07%