W

Wav2vec2 Lv 60 Espeak Cv Ft

由 facebook 开发
该模型是基于Wav2Vec2-Large-LV60预训练模型,在CommonVoice数据集上进行微调,用于多语言音素识别。
下载量 18.77k
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型主要用于多语言的音素识别任务,能够将语音输入转换为音素标签。需要配合音素到单词的映射词典使用。

模型特点

多语言支持
支持多种语言的音素识别
基于CommonVoice微调
在CommonVoice数据集上进行微调,提高了识别准确性
音素级别识别
输出为音素标签,需要配合词典转换为单词

模型能力

语音识别
音素识别
多语言处理

使用案例

语音转写
多语言语音转录
将多种语言的语音转换为音素标签
可进一步转换为文字
语音学研究
音素分析
用于分析不同语言的音素分布和特征