W

Wav2vec2 Xls R Adult Child Cls

由 bookbot 开发
基于XLS-R架构的音频分类模型,用于区分成人和儿童语音。
下载量 20
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型是在私有成人/儿童语音分类数据集上对wav2vec2-xls-r-300m进行微调的版本,主要用于语音分类任务。

模型特点

高准确率
在评估数据集上达到94.69%的准确率和0.9508的F1值。
基于XLS-R架构
利用XLS-R架构的强大特征提取能力进行语音分类。
高效训练
使用梯度累积和线性学习率调度器优化训练过程。

模型能力

音频分类
成人/儿童语音区分

使用案例

语音分析
儿童语音识别
用于识别和分类儿童语音,适用于教育或儿童产品领域。
准确率94.69%
成人语音识别
用于识别和分类成人语音,适用于客服或语音助手领域。
F1值0.9508