W

Wav2vec2 Base Ft Keyword Spotting Int8

由 dkurt 开发
基于wav2vec2架构的语音关键词检测模型,经过OpenVINO量化优化
下载量 14
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是基于wav2vec2架构的语音处理模型,专门用于关键词检测任务。经过Optimum OpenVINO量化处理后,模型在保持较高准确率的同时提升了推理效率。

模型特点

高效量化
通过Optimum OpenVINO进行量化处理,在准确率仅下降2.74%的情况下显著提升推理效率
高准确率
在评估集上达到0.9828的基准准确率,量化后仍保持0.9553的高准确率
轻量级
基于wav2vec2-base架构,相对轻量且适合边缘设备部署(推断)

模型能力

语音关键词识别
实时音频处理
边缘设备部署

使用案例

智能家居
语音唤醒词检测
用于检测设备唤醒词如'Hey Siri'、'OK Google'等
高准确率确保设备能可靠响应
工业应用
语音控制指令识别
在嘈杂工业环境中识别特定语音指令
量化后模型适合部署在边缘设备