A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V6

由 gary109 开发
该模型是基于wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上微调的自动语音识别模型。
下载量 160
发布时间 : 6/28/2022
模型介绍
内容详情
替代品

模型简介

这是一个用于自动语音识别(ASR)的模型,专门针对Stepmania游戏中的音频数据进行优化。

模型特点

基于wav2vec2架构
使用wav2vec2-large-xlsr-53作为基础模型,具有良好的语音识别能力
针对游戏音频优化
专门在Stepmania游戏音频数据集上进行微调,适合游戏场景的语音识别
多轮次训练
经过10轮训练,验证损失稳定在1.0左右,词错误率约0.65

模型能力

语音识别
音频转录
游戏音频处理

使用案例

游戏
Stepmania游戏语音识别
识别Stepmania游戏中的语音指令
词错误率约0.65
语音转录
游戏音频转录
将游戏中的语音内容转录为文字