W

Wavlm Basic S R 5c 8batch 5sec 0.0001lr Unfrozen

由 reralle 开发
基于microsoft/wavlm-large微调的语音处理模型,在评估集上准确率达75%
下载量 16
发布时间 : 4/30/2023
模型介绍
内容详情
替代品

模型简介

该模型是针对语音处理任务优化的WavLM架构变体,适用于短音频片段分析

模型特点

高效微调
使用0.0001学习率进行精细调整,保持预训练模型核心能力
短音频处理
针对5秒音频片段优化,适合实时处理场景
稳定训练
采用梯度累积(步数4)和线性学习率调度,确保训练稳定性

模型能力

语音特征提取
短音频分类
语音模式识别

使用案例

语音分析
情感识别
分析短语音片段中的情感倾向
准确率75%
语音指令分类
识别短语音命令类别
F1分数0.75