A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3

由 gary109 开发
基于wav2vec2-large-xlsr-53的自动语音识别模型,在GARY109/AI_LIGHT_DANCE数据集上微调
下载量 191
发布时间 : 6/25/2022
模型介绍
内容详情
替代品

模型简介

该模型是针对Stepmania游戏音频优化的自动语音识别模型,主要用于识别游戏中的音频指令或节奏点。

模型特点

高精度语音识别
基于wav2vec2-large-xlsr-53架构,提供较高的语音识别准确率
游戏音频优化
专门针对Stepmania游戏音频进行微调,适合游戏场景使用
多轮训练优化
经过10轮训练,模型性能逐步提升并趋于稳定

模型能力

自动语音识别
游戏音频处理
节奏点检测

使用案例

游戏应用
Stepmania游戏指令识别
识别游戏中的音频指令,辅助游戏操作
词错误率0.6928
游戏节奏分析
分析游戏音频中的节奏点,用于游戏辅助工具开发