Neunit Ks 529

由 SHENMU007 开发

基于facebook/wav2vec2-base在SUPERB数据集上微调的音频分类模型，准确率达99.98%

音频分类

Transformers

开源协议:Apache-2.0 #音频分类 #高准确率 #wav2vec2微调

下载量 14

发布时间 : 5/29/2023

模型介绍

内容详情

替代品

模型简介

该模型是用于音频分类任务的微调版本，基于wav2vec2架构，在SUPERB数据集上表现出色。

模型特点

高准确率

在评估集上取得了99.98%的准确率

基于wav2vec2架构

采用facebook/wav2vec2-base作为基础模型

高效训练

使用混合精度训练和梯度累积技术优化训练过程

模型能力

音频分类

语音特征提取

使用案例

语音处理

语音命令识别

可用于识别特定语音命令或关键词

高准确率识别

音频内容分类

对音频内容进行分类和标记

训练损失	轮次	步数	验证损失	准确率
0.0303	1.0	1388	0.0231	0.9965
0.003	2.0	2777	0.0030	0.9995
0.0018	3.0	4165	0.0026	0.9995
0.0037	4.0	5554	0.0017	0.9998
0.0002	5.0	6940	0.0017	0.9998

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

AIbase是一个专注于MCP服务的平台，为AI开发者提供高质量的模型上下文协议服务，助力AI应用开发。

简体中文

热门模型

Llama 3 Typhoon V1.5x 8b Instruct

Cadet Tiny

Roberta Base Chinese Extractive Qa

热门模型分类

热门标签

Neunit Ks 529

模型简介

模型特点

模型能力

使用案例

neunit-ks-529

模型描述

预期用途与限制

训练与评估数据

训练流程

训练超参数

训练结果

框架版本