M

My Awesome Mind Model

由 Gyaneshere 开发
基于facebook/wav2vec2-base模型在minds14数据集上微调的音频分类模型
下载量 4
发布时间 : 2/7/2025
模型介绍
内容详情
替代品

模型简介

这是一个用于音频分类的微调模型,主要用于识别说话者意图。模型基于wav2vec2架构,在minds14数据集上进行了微调。

模型特点

基于wav2vec2架构
使用facebook开源的wav2vec2-base模型作为基础架构
轻量级微调
在minds14数据集上进行了10个epoch的微调

模型能力

音频分类
说话者意图识别

使用案例

语音交互
语音助手意图识别
识别用户通过语音表达的意图