A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7

由 gary109 开发
基于wav2vec2-large-xlsr-53的自动语音识别模型,专为StepMania游戏音频优化,在GARY109/AI_LIGHT_DANCE数据集上微调
下载量 162
发布时间 : 6/30/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对StepMania游戏音频优化的自动语音识别(ASR)模型,通过微调wav2vec2-large-xlsr-53架构实现,在特定游戏音频数据集上表现出色

模型特点

游戏音频优化
专门针对StepMania游戏音频数据进行优化,识别效果更佳
微调版本
基于wav2vec2-large-xlsr-53模型微调,保留原模型强大特征提取能力
低词错误率
在评估集上达到0.6512的词错误率(WER),表现优异

模型能力

游戏音频识别
语音转文本
节奏游戏音频分析

使用案例

游戏开发
StepMania游戏音频分析
用于分析StepMania游戏中的音频节奏和内容
词错误率0.6512
语音识别
特定领域语音识别
适用于游戏音频等特定领域的语音识别任务