W

W2v Bert 2.0

由 facebook 开发
基于Conformer架构的语音编码器,在450万小时无标注音频数据上预训练,支持143种以上语言
下载量 477.05k
发布时间 : 12/19/2023
模型介绍
内容详情
替代品

模型简介

W2v-BERT 2.0是一个强大的语音编码器,采用Conformer架构,经过大规模多语言音频数据预训练,可作为语音处理任务的基础模型。

模型特点

大规模多语言预训练
在450万小时无标注音频数据上预训练,覆盖143种以上语言
先进架构
采用Conformer架构,结合CNN和Transformer的优势
灵活应用
可作为基础模型进行微调,适用于多种语音处理任务

模型能力

语音特征提取
多语言语音处理
音频嵌入生成

使用案例

语音识别
自动语音识别(ASR)
通过微调模型实现高精度语音转文本
支持多种语言的语音识别
音频分析
音频分类
利用提取的音频特征进行分类任务