W

Wav2vec2 Large Xlsr Greek 2

由 skylord 开发
基于facebook/wav2vec2-large-xlsr-53在希腊语Common Voice数据集上微调的语音识别模型,通过合成女性声音数据平衡训练集
下载量 15
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对希腊语的自动语音识别(ASR)模型,基于Facebook的XLSR-53大模型微调而成,特别处理了希腊语语音数据中性别不平衡问题

模型特点

性别平衡训练数据
通过Google TTS合成女性语音数据,解决了原始数据集中男性声音占主导的问题
多阶段微调
采用分阶段微调策略,先在原始数据上训练,再添加合成数据继续训练
希腊语优化
专门针对希腊语语音特点进行优化,处理希腊语特有的发音和语调

模型能力

希腊语语音识别
16kHz音频处理
无语言模型直接推理

使用案例

语音转文字
希腊语语音转录
将希腊语语音内容转换为文字
在Common Voice测试集上达到45.05% WER
语音助手
希腊语语音指令识别
用于希腊语语音助手的基础语音识别组件