W

Wav2vec2 Base Superb Ks

由 superb 开发
基于wav2vec2-base的SUPERB关键词检测模型,专为16kHz语音设计
下载量 5,820
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型移植自S3PRL,用于关键词检测任务,能够将语音分类到预定义词表中识别注册关键词。

模型特点

高准确率
在Speech Commands v1.0测试集上达到96.43%的准确率
设备端友好
专为兼顾准确率、模型体积和推理速度的设备端运行设计
标准化处理
采用16kHz统一采样率,确保输入语音的标准化处理

模型能力

语音分类
关键词识别
静音检测
未知词检测

使用案例

智能设备控制
语音助手唤醒词检测
用于检测设备唤醒词如'Hey Siri'或'OK Google'
高准确率识别减少误触发
无障碍技术
语音控制界面
为行动不便用户提供语音控制命令识别
实现高效准确的命令识别