T

Trillsson3 Ft Keyword Spotting

由 vumichien 开发
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务
下载量 30
发布时间 : 11/28/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于vumichien/nonsemantic-speech-trillsson3在superb数据集上微调的版本,主要用于关键词识别任务,在评估集上取得了90.41%的准确率。

模型特点

高准确率
在superb数据集上达到90.41%的准确率
微调模型
基于TRillsson3预训练模型进行微调,适应关键词识别任务
高效训练
使用Adam优化器和混合精度训练,训练效率高

模型能力

音频分类
关键词识别
语音特征提取

使用案例

语音交互
语音助手唤醒词检测
检测设备唤醒词如'Hey Siri'或'OK Google'
准确率90.41%
语音命令识别
识别简短的语音命令