W

Whisper Large V3 Ca 3catparla

由 projecte-aina 开发
这是一个针对加泰罗尼亚语优化的自动语音识别模型,基于OpenAI的Whisper-large-v3微调,由巴塞罗那超级计算中心开发。
下载量 122
发布时间 : 8/5/2024
模型介绍
内容详情
替代品

模型简介

该模型专门用于加泰罗尼亚语的自动语音识别任务,能够将加泰罗尼亚语音频转换为无标点的纯文本。

模型特点

高精度加泰罗尼亚语识别
在3CatParla测试集上达到0.96的WER(词错误率)
多方言支持
能够识别加泰罗尼亚语的不同方言变体
大规模训练数据
使用710小时的加泰罗尼亚语数据进行微调

模型能力

加泰罗尼亚语音频转录
自动语音识别
支持16kHz采样率音频处理

使用案例

语音转录
广播电视内容转录
将加泰罗尼亚语广播电视节目自动转录为文本
在3CatParla测试集上WER为0.96
方言语音识别
识别不同地区的加泰罗尼亚语方言
在不同方言测试集上WER在7.88-12.25之间