V

Voc2vec Hubert Ls Pt

由 alkiskoudounas 开发
voc2vec是专为非语言人类数据设计的基础模型,基于HuBERT框架构建,在125小时非语言音频数据上预训练。
下载量 114
发布时间 : 4/14/2025
模型介绍
内容详情
替代品

模型简介

该模型专注于非语言人类声音的分类和分析,特别适用于婴儿啼哭等非语言发声场景。

模型特点

非语言发声专用
专门针对非语言人类声音(如婴儿啼哭、笑声等)优化的预训练模型
多数据集预训练
在10个不同数据集组成的125小时非语言音频上进行预训练
HuBERT架构
基于HuBERT框架构建,继承了其优秀的音频表示学习能力
迁移学习友好
从LibriSpeech预训练模型继续训练,适合下游任务微调

模型能力

非语言音频分类
婴儿啼哭识别
音频特征提取

使用案例

婴幼儿护理
婴儿啼哭识别
识别和分析婴儿不同类型的啼哭(饥饿、不适等)
在Donate a Cry等婴儿啼哭数据集上表现优异
医疗辅助
非语言症状分析
分析患者非语言发声以辅助医疗诊断