W

Wav2vec2 Base Keyword Spotting

由 anton-l 开发
基于wav2vec2-base模型在superb数据集上微调的语音关键词识别模型,准确率达98.43%
下载量 14
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是用于语音关键词识别的微调模型,基于Facebook的wav2vec2-base架构,在superb数据集上进行训练,能够高效识别语音中的关键词。

模型特点

高准确率
在评估集上达到98.43%的准确率,表现优异
基于wav2vec2架构
采用Facebook开源的wav2vec2-base模型作为基础架构
高效训练
使用混合精度训练和梯度累积等技术优化训练效率

模型能力

语音关键词识别
音频分类

使用案例

语音交互
语音助手唤醒词检测
用于检测设备唤醒词,如'Hey Siri'等
高准确率识别特定关键词
语音指令识别
识别语音指令中的关键命令词