A

Ast Finetuned Speech Commands V2

由 Xenova 开发
基于AST架构的语音命令识别模型,专为网页端部署优化的ONNX格式版本
下载量 15
发布时间 : 6/27/2023
模型介绍
内容详情
替代品

模型简介

该模型是MIT发布的语音命令识别模型,基于Audio Spectrogram Transformer (AST)架构微调,转换为ONNX格式以适配Transformers.js库的网页端部署需求

模型特点

网页端优化
转换为ONNX格式以适配Transformers.js,支持浏览器环境直接运行
轻量级部署
专为边缘计算场景设计,适合资源受限的客户端应用
实时处理
针对语音命令识别场景优化,具备低延迟特性

模型能力

语音命令识别
音频分类
实时语音处理

使用案例

智能家居
语音控制设备
通过语音命令控制智能家居设备
实现高准确率的免接触控制
无障碍技术
语音辅助系统
为行动不便用户提供语音交互界面
降低设备操作门槛