Trillsson3-ft-keyword-spotting开源音频分类模型

Trillsson3 Ft Keyword Spotting

由 vumichien 开发

基于TRillsson3架构的音频分类模型，在superb数据集上微调，用于关键词识别任务

下载量 30

发布时间 : 11/28/2022

模型简介

该模型是基于vumichien/nonsemantic-speech-trillsson3在superb数据集上微调的版本，主要用于关键词识别任务，在评估集上取得了90.41%的准确率。

高准确率

在superb数据集上达到90.41%的准确率

微调模型

基于TRillsson3预训练模型进行微调，适应关键词识别任务

高效训练

使用Adam优化器和混合精度训练，训练效率高

音频分类

关键词识别

语音特征提取

语音交互

语音助手唤醒词检测

检测设备唤醒词如'Hey Siri'或'OK Google'

准确率90.41%

语音命令识别

识别简短的语音命令