A

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53 5gram V1

由 gary109 开发
该模型是基于wav2vec2-large-xlsr-53的自动语音识别模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING数据集上微调得到,主要用于歌唱语音识别。
下载量 18
发布时间 : 6/18/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于歌唱语音识别的自动语音识别模型,基于wav2vec2-large-xlsr-53架构微调,在特定歌唱数据集上表现出色。

模型特点

高精度歌唱识别
在ONSET-SINGING数据集上微调,专门针对歌唱语音识别优化
基于wav2vec2架构
采用强大的wav2vec2-large-xlsr-53作为基础模型
低词错误率
在评估集上取得16.68%的词错误率

模型能力

歌唱语音识别
自动语音转录

使用案例

音乐技术
歌唱内容转录
将歌唱录音自动转换为文本
词错误率16.68%
音乐教育辅助
帮助音乐学习者分析歌唱发音