ast-finetuned-speech-commands-v2开源语音命令识别模型

首页

Ast Finetuned Speech Commands V2

由 Xenova 开发

基于AST架构的语音命令识别模型，专为网页端部署优化的ONNX格式版本

音频分类

Transformers

#语音指令识别 #ONNX格式 #网页端适配

下载量 15

发布时间 : 6/27/2023

模型简介

该模型是MIT发布的语音命令识别模型，基于Audio Spectrogram Transformer (AST)架构微调，转换为ONNX格式以适配Transformers.js库的网页端部署需求

模型特点

网页端优化

转换为ONNX格式以适配Transformers.js，支持浏览器环境直接运行

轻量级部署

专为边缘计算场景设计，适合资源受限的客户端应用

实时处理

针对语音命令识别场景优化，具备低延迟特性

模型能力

语音命令识别

音频分类

实时语音处理

使用案例

智能家居

语音控制设备

通过语音命令控制智能家居设备

实现高准确率的免接触控制

无障碍技术

语音辅助系统

为行动不便用户提供语音交互界面

降低设备操作门槛

属性	详情
基础模型	MIT/ast-finetuned-speech-commands-v2
库名称	transformers.js

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

uer

2,694

智启未来，您的人工智能解决方案智库

简体中文

Ast Finetuned Speech Commands V2

模型简介

模型特点

模型能力

使用案例

🚀 AST语音命令微调模型（ONNX适配版）

🚀 快速开始

📚 详细文档