A

Asr Whisper Medium Commonvoice Fa

由 speechbrain 开发
基于CommonVoice-14.0波斯语数据集微调的whisper medium模型,用于波斯语自动语音识别任务。
下载量 21
发布时间 : 7/20/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于whisper-medium架构的自动语音识别系统,专门针对波斯语进行了优化,能够将波斯语音频转换为文本。

模型特点

预训练模型微调
基于预训练的whisper-medium模型在波斯语数据上进行微调,保留了原模型的强大特征提取能力
高效训练
冻结了预训练的whisper编码器,只微调解码器部分,提高了训练效率
自动音频处理
内置音频标准化处理,包括自动重采样和单声道选择

模型能力

波斯语语音识别
音频转录
语音转文本

使用案例

语音转录
波斯语语音转文本
将波斯语音频文件转换为文本格式
在CommonVoice测试集上达到35.48%的词错误率
语音助手
波斯语语音命令识别
用于构建波斯语语音助手的基础识别模块