W

Whisper Large V3 Broad Accent

由 tiantiaf 开发
基于Whisper-Large-v3的英语广泛口音分类模型,可识别不列颠群岛、北美地区和其他三类英语口音
下载量 156
发布时间 : 5/22/2025
模型介绍
内容详情
替代品

模型简介

该模型实现了《Vox-Profile: 用于表征多样化说话者与语音特征的语音基础模型基准》中描述的广泛口音分类方法,专门用于英语口音分类任务

模型特点

广泛口音覆盖
支持不列颠群岛、北美地区和其他三大类英语口音的分类
基于Whisper架构
利用openai/whisper-large-v3作为基础模型,具有强大的语音特征提取能力
专业语音分析
源自《Vox-Profile》论文的专业语音特征分析方法

模型能力

英语口音分类
语音特征提取
短音频处理(3-15秒)

使用案例

语音分析
口音识别服务
识别说话者的英语口音类型
输出不列颠群岛/北美地区/其他三类概率分布
语音特征分析
提取语音的深层特征表示
可用于下游语音相关任务