wav2vec2_s-f-o_8batch_5sec_0.0001lr_unfrozen开源语音处理模型

Wav2vec2 S F O 8batch 5sec 0.0001lr Unfrozen

由 reralle 开发

基于facebook/wav2vec2-large微调的语音处理模型，支持语音识别任务

下载量 21

发布时间 : 5/5/2023

模型简介

该模型是基于facebook/wav2vec2-large架构微调的版本，主要用于语音相关任务，在评估集上取得了66.67%的准确率和67.42%的F1值。

高效微调

基于预训练的wav2vec2-large模型进行微调，充分利用了大规模预训练的优势

优化训练

采用8的批次大小和0.0001的学习率进行训练，确保了训练稳定性

线性学习率调度

使用线性学习率调度器配合0.003的预热比例，优化了训练过程

语音识别

音频特征提取

语音处理

语音转文本

将语音信号转换为文本内容

在评估集上达到66.67%的准确率