whisper-medium-fleurs-lang-id开源语音语种识别模型

首页

Whisper Medium Fleurs Lang Id

由 sanchit-gandhi 开发

基于OpenAI Whisper-medium微调的语音语种识别模型，在FLEURS数据集上达到88.05%准确率

音频分类

Transformers

开源协议:Apache-2.0 #多语言语种识别 #音频分类 #高准确率

下载量 590.30k

发布时间 : 2/23/2023

模型简介

该模型专门用于语音语种识别任务，能够准确识别音频片段所属的语言类别

模型特点

高准确率语种识别

在FLEURS评估集上达到88.05%的识别准确率

基于Whisper架构

基于OpenAI强大的Whisper-medium模型微调，继承了其优秀的语音处理能力

多GPU训练优化

采用多GPU分布式训练，配合梯度累积技术提高训练效率

模型能力

语音语种识别

音频分类

使用案例

语音处理

多语言语音分类

自动识别音频片段所属的语言类别

88.05%的识别准确率

语音内容预处理

为语音识别系统预先识别语言类型

训练损失	轮数	步数	验证损失	准确率
0.0152	1.0	8494	0.9087	0.8431
0.0003	2.0	16988	1.0059	0.8460
0.0	3.0	25482	0.8413	0.8805

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Whisper Medium Fleurs Lang Id

模型简介

模型特点

模型能力

使用案例

🚀 Whisper Medium FLEURS 语言识别

📚 文档详情

模型描述

预期用途与限制

训练和评估数据

训练过程

训练超参数

训练结果

框架版本

📄 许可证

🏷️ 标签

📊 数据集

📈 评估指标

🧰 基础模型

📜 模型索引