0

0 9up Ast Ft

由 mazkooleg 开发
该模型是基于MIT/ast-finetuned-speech-commands-v2在数字语音命令数据集上微调的音频分类模型,主要用于识别0-9数字语音命令
下载量 19
发布时间 : 2/26/2023
模型介绍
内容详情
替代品

模型简介

这是一个经过微调的音频频谱变换器(AST)模型,专门用于语音命令识别任务,在数字识别方面表现出色

模型特点

高准确率
在评估集上达到99.79%的准确率
微调优化
基于预训练模型在特定语音命令数据集上进行了优化
高效训练
使用梯度累积等技术实现了高效训练

模型能力

数字语音识别
音频分类
命令词检测

使用案例

语音交互
数字语音输入系统
用于需要数字输入的语音交互系统
高准确率的数字识别
语音控制设备
支持数字命令的智能家居或工业设备控制