W

Whisper Large V3 Russian Ties Podlodka V1.2

由 Apel-sin 开发
基于TIES融合方法的俄语语音识别模型,整合了两个Whisper-large-v3俄语变体,针对电话录音场景优化
下载量 2,408
发布时间 : 4/2/2025
模型介绍
内容详情
替代品

模型简介

该模型通过TIES融合方法合并了两个俄语Whisper模型,专注于提高俄语语音识别准确率,特别优化了电话通话场景下的识别性能

模型特点

TIES融合技术
采用先进的TIES模型融合方法,稀疏密度0.9,编码器/解码器差异化权重分配(0.8/0.2和0.2/0.8)
电话场景优化
专门针对电话录音场景优化,建议配合音频预处理流程使用
多数据集训练
融合了Common Voice 17.0、Taiga Speech、Podlodka等多个俄语语音数据集

模型能力

俄语语音转文本
长音频分块处理
时间戳生成
低资源设备支持

使用案例

语音转录
电话录音转写
将俄语电话通话内容转换为文字记录
针对电话音频优化的识别准确率
会议记录生成
自动生成俄语会议音频的文字记录
支持长音频分块处理