W

Wav2vec2 Base Finetuned Speech Commands V0.02

由 0xb1 开发
该模型是基于facebook/wav2vec2-base在speech_commands数据集上微调的语音命令识别模型,准确率达97.59%。
下载量 1.2M
发布时间 : 4/8/2023
模型介绍
内容详情
替代品

模型简介

基于wav2vec2架构的语音命令识别模型,专门用于识别短语音命令。

模型特点

高准确率
在speech_commands评估集上达到97.59%的准确率
基于wav2vec2架构
利用wav2vec2强大的语音特征提取能力
轻量级微调
在基础模型上进行针对性微调,保持高效的同时提升特定任务性能

模型能力

语音命令识别
短语音分类
语音特征提取

使用案例

智能家居控制
语音控制指令识别
识别开灯、关灯等简单语音指令
准确率97.59%
语音助手
基础命令识别
识别是/否、开始/停止等基础交互命令