A

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53

由 gary109 开发
该模型是基于facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上微调的自动语音识别模型
下载量 40
发布时间 : 6/22/2022
模型介绍
内容详情
替代品

模型简介

用于语音识别任务的微调模型,基于wav2vec2-large-xlsr-53架构,在特定数据集上进行了优化

模型特点

基于XLSR架构
采用wav2vec2-large-xlsr-53架构,具有强大的语音特征提取能力
特定领域微调
在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2数据集上进行了优化
高效训练
使用混合精度训练和梯度累积等技术提高训练效率

模型能力

语音识别
音频特征提取
自动转录

使用案例

音乐游戏
节奏游戏音轨分析
用于分析节奏游戏中的音频节拍和模式
语音处理
语音转文本
将语音内容转换为文本格式