L

Lang Id Voxlingua107 Ecapa

由 apenasissso 开发
基于VoxLingua107数据集训练的ECAPA-TDNN架构口语识别模型,支持107种语言分类
下载量 19
发布时间 : 10/23/2023
模型介绍
内容详情
替代品

模型简介

该模型用于口语识别和语音片段级别的特征提取,采用ECAPA-TDNN架构,在VoxLingua107数据集上训练

模型特点

多语言支持
支持107种不同语言的识别,涵盖全球主要语种
ECAPA-TDNN架构
采用先进的ECAPA-TDNN架构,优化了语音嵌入提取性能
自动音频处理
自动处理16kHz采样率的音频,包括重采样和单声道转换
双重用途
既可直接用于语言识别,也可作为特征提取器用于下游任务

模型能力

口语识别
语音特征提取
多语言分类

使用案例

语言识别
多语言语音分类
识别语音片段所属的语言类别
在VoxLingua107开发集上达到6.7%错误率
语音处理
语音嵌入提取
提取语音片段的特征向量用于下游任务