W

Whisper Medium Fleurs Lang Id

由 sanchit-gandhi 开发
基于OpenAI Whisper-medium微调的语音语种识别模型,在FLEURS数据集上达到88.05%准确率
下载量 590.30k
发布时间 : 2/23/2023
模型介绍
内容详情
替代品

模型简介

该模型专门用于语音语种识别任务,能够准确识别音频片段所属的语言类别

模型特点

高准确率语种识别
在FLEURS评估集上达到88.05%的识别准确率
基于Whisper架构
基于OpenAI强大的Whisper-medium模型微调,继承了其优秀的语音处理能力
多GPU训练优化
采用多GPU分布式训练,配合梯度累积技术提高训练效率

模型能力

语音语种识别
音频分类

使用案例

语音处理
多语言语音分类
自动识别音频片段所属的语言类别
88.05%的识别准确率
语音内容预处理
为语音识别系统预先识别语言类型