S

Seamless M4t V2 Large Speech Encoder

由 WueNLP 开发
从SeamlessM4Tv2-Large中提取的语音编码器模块,擅长跨语言和多语言的序列级音频分类任务
下载量 67
发布时间 : 11/18/2024
模型介绍
内容详情
替代品

模型简介

该模型是一个多语言语音编码器,专门用于音频分类任务,支持超过100种语言。

模型特点

多语言支持
支持超过100种语言的语音编码和分类
音频分类
擅长跨语言和多语言的序列级音频分类任务
高效处理
优化用于处理16kHz音频波形

模型能力

音频特征提取
多语言音频分类
语音编码

使用案例

语音识别
多语言语音分类
对多种语言的语音进行分类
在SIB-Fleurs数据集上表现优异
语音处理
语音特征提取
从语音中提取有用的特征