W

Whisper Large V3 Turbo STT Zeroth KO V2

由 o0dimplz0o 开发
基于Whisper Large v3 Turbo优化的韩语自动语音识别模型,提供高准确率且带时间戳的转写结果
下载量 662
发布时间 : 2/3/2025
模型介绍
内容详情
替代品

模型简介

该模型是openai/whisper-large-v3-turbo的优化版本,专门针对韩语自动语音识别(ASR)任务进行微调,旨在提供高准确率的语音转写功能。

模型特点

韩语优化
专门针对韩语语音识别进行微调,提供更高的转写准确率
时间戳支持
转写结果包含时间戳信息,便于音频内容定位
增量式微调
采用分阶段增量式微调策略,持续优化模型性能
数据增强
训练过程中应用20%随机数据增强,提高模型鲁棒性

模型能力

韩语语音识别
带时间戳的转写
高准确率语音转文本

使用案例

语音转写
韩语会议记录
将韩语会议录音自动转写为带时间戳的文本
词错误率19.9134%,字错误率0.0660%
韩语媒体字幕生成
为韩语视频内容自动生成字幕
语音分析
韩语语音内容分析
分析韩语语音内容,提取关键信息