T

Trillsson3 Ft Keyword Spotting 14

由 vumichien 开发
基于TRillsson3架构的音频分类模型,在superb数据集上微调,用于关键词识别任务,准确率达91.5%。
下载量 47
发布时间 : 10/25/2022
模型介绍
内容详情
替代品

模型简介

该模型是在非语义语音表示模型TRillsson3基础上微调的版本,专门用于关键词识别任务。通过superb数据集的训练,在评估集上表现出色。

模型特点

高准确率
在评估集上达到91.5%的准确率,表现优异
基于TRillsson3架构
建立在强大的非语义语音表示模型基础上
高效训练
使用混合精度训练和Adam优化器,训练效率高

模型能力

音频分类
关键词识别
语音特征提取

使用案例

智能语音交互
语音助手唤醒词检测
用于检测设备唤醒词如'Hey Siri'或'OK Google'
高准确率确保唤醒成功率
语音控制命令识别
识别特定语音命令以控制系统操作
语音分析
语音内容分类
对语音内容进行关键词分类和标记