A

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53

由 gary109 开发
该模型是基于facebook/wav2vec2-large-xlsr-53在AI_LIGHT_DANCE - ONSET-SINGING数据集上微调的自动语音识别模型,主要用于歌唱语音识别任务。
下载量 23
发布时间 : 6/15/2022
模型介绍
内容详情
替代品

模型简介

这是一个针对歌唱语音识别任务优化的自动语音识别模型,基于wav2vec2-large-xlsr-53架构微调而成,在评估集上取得了20.43%的词错误率。

模型特点

歌唱语音识别优化
专门针对歌唱语音进行微调,相比通用语音识别模型在歌唱场景表现更优
低词错误率
在评估集上取得20.43%的词错误率,表现良好
基于XLSR架构
采用跨语言语音表示学习的大规模预训练模型作为基础

模型能力

歌唱语音识别
音频转文本
音乐内容分析

使用案例

音乐分析
歌唱歌词转录
将歌唱录音自动转换为歌词文本
词错误率20.43%
音乐内容检索
通过歌词内容搜索音乐片段
音乐教育
歌唱练习评估
分析歌唱录音与标准歌词的匹配度