W

Wav2vec2 Xls R 300m Phoneme

由 vitouphy 开发
基于facebook/wav2vec2-xls-r-300m微调的语音识别模型,专注于音素识别任务
下载量 12.26k
发布时间 : 5/19/2022
模型介绍
内容详情
替代品

模型简介

该模型是wav2vec2-xls-r-300m的微调版本,专门用于音素识别任务。在评估集上取得了0.1332的字符错误率(Cer)。

模型特点

高效音素识别
针对音素识别任务进行了优化,在评估集上取得了较低的字符错误率
基于大规模预训练模型
基于wav2vec2-xls-r-300m模型微调,继承了其强大的语音特征提取能力
优化的训练配置
采用精心调优的训练参数,包括学习率调度和梯度累积策略

模型能力

语音识别
音素识别
音频特征提取

使用案例

语音处理
语音转音素
将语音信号转换为音素序列
字符错误率0.1332
语音分析
用于语音学研究中的音素分析