W

Wavlm Large Age Sex

由 tiantiaf 开发
基于 WavLM-Large 的音频分类模型,用于精准识别说话人的年龄和性别。
下载量 387
发布时间 : 5/21/2025

模型简介

该模型主要用于音频分类任务,能够实现年龄和性别的精准分类,为音频数据的分析和处理提供有效解决方案。

模型特点

精准分类
能够实现年龄和性别的精准分类。
标准化输出
性别标签为 ['Female', 'Male'],年龄输出范围为 0-1,乘以 100 即为实际年龄。
学术支持
基于《Vox-Profile》论文中的方法实现,具有学术研究背景。

模型能力

音频分类
年龄预测
性别识别

使用案例

音频分析
说话人特征分析
用于分析音频中说话人的年龄和性别特征。
提供精准的年龄和性别分类结果。
AIbase
智启未来,您的人工智能解决方案智库
简体中文