L

Lang Id Voxlingua107 Ecapa

由 speechbrain 开发
基于SpeechBrain框架和ECAPA-TDNN架构的语音语言识别模型,支持107种语言的识别和语音嵌入向量提取。
下载量 330.01k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型采用ECAPA-TDNN架构,在VoxLingua107数据集上训练,可用于语音语言识别或作为语音片段特征提取器。支持16kHz采样率的单声道音频输入。

模型特点

多语言支持
支持107种语言的识别,涵盖全球主要语言和部分小语种
双重用途
既可直接用于语言识别,也可作为特征提取器用于构建专用模型
高性能架构
采用ECAPA-TDNN架构,在VoxLingua107开发集上错误率仅为6.7%
自动音频处理
内置音频标准化功能,自动处理采样率和声道转换

模型能力

语音语言识别
语音特征提取
多语言处理

使用案例

语音处理
多语言语音分类
识别语音片段所属的语言类别
在VoxLingua107开发集上错误率6.7%
语音特征提取
提取语音片段的嵌入向量用于下游任务
256维特征向量
内容管理
多语言内容分类
对用户生成的多语言语音内容进行分类管理