W

Whisper Large V2 Mix Jp

由 vumichien 开发
基于OpenAI Whisper-large-v2模型在日语语音数据集上微调的自动语音识别(ASR)模型
下载量 93
发布时间 : 12/19/2022
模型介绍
内容详情
替代品

模型简介

该模型是Whisper-large-v2的日语优化版本,专门针对日语语音识别任务进行了微调,在词错误率(WER)和字错误率(CER)指标上表现优异。

模型特点

日语优化
在JSUT、JSSS、CSS10和Common Voice日语数据集上专门微调,优化日语语音识别性能
低错误率
在测试集上达到7.65%的词错误率(WER)和4.72%的字错误率(CER)
高效训练
采用混合精度训练和梯度累积技术,优化训练效率

模型能力

日语语音转文本
高精度语音识别
长音频处理

使用案例

语音转录
日语会议记录
将日语会议录音自动转换为文字记录
准确率约92.35% (基于1-WER)
日语媒体字幕生成
为日语视频内容自动生成字幕
语音助手
日语语音指令识别
用于日语语音助手系统的语音指令理解