W

Wav2vec2 S F O 8batch 5sec 0.0001lr Unfrozen

由 reralle 开发
基于facebook/wav2vec2-large微调的语音处理模型,支持语音识别任务
下载量 21
发布时间 : 5/5/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于facebook/wav2vec2-large架构微调的版本,主要用于语音相关任务,在评估集上取得了66.67%的准确率和67.42%的F1值。

模型特点

高效微调
基于预训练的wav2vec2-large模型进行微调,充分利用了大规模预训练的优势
优化训练
采用8的批次大小和0.0001的学习率进行训练,确保了训练稳定性
线性学习率调度
使用线性学习率调度器配合0.003的预热比例,优化了训练过程

模型能力

语音识别
音频特征提取

使用案例

语音处理
语音转文本
将语音信号转换为文本内容
在评估集上达到66.67%的准确率