W

Whisper Large V2 Ko

由 byoussef 开发
基于OpenAI Whisper-large-v2微调的韩语自动语音识别(ASR)模型,在韩语数据集上表现出色
下载量 94
发布时间 : 3/10/2023
模型介绍
内容详情
替代品

模型简介

该模型是OpenAI Whisper-large-v2的韩语微调版本,专门针对韩语语音识别任务进行了优化,在Zeroth Korean数据集上取得了2.9%的词错误率(WER)

模型特点

低词错误率
在韩语测试集上仅2.9%的词错误率,表现优异
多GPU训练
使用7块GPU进行高效训练,总训练批次大小达224
优化的训练过程
采用线性学习率调度和500步预热,训练50轮达到最佳效果

模型能力

韩语语音识别
语音转文本
高准确率转录

使用案例

语音转录
韩语会议记录
将韩语会议录音自动转录为文本
高准确率的文字记录
韩语语音助手
为韩语语音助手提供语音识别能力
准确的语音指令识别
教育
韩语学习应用
帮助韩语学习者检查发音准确性
提供准确的发音反馈