K

Kotoba Whisper V2.0

由 kotoba-tech 开发
Kotoba-Whisper是由Asahi Ushio与Kotoba Technologies合作开发的日语自动语音识别蒸馏模型,基于Whisper large-v3蒸馏而来,推理速度提升6.3倍。
下载量 8,108
发布时间 : 9/17/2024
模型介绍
内容详情
替代品

模型简介

日语自动语音识别模型,通过知识蒸馏技术优化Whisper large-v3模型,在保持相近错误率的同时显著提升推理速度。

模型特点

高效推理
相比原版Whisper large-v3,推理速度提升6.3倍
高性能
在ReazonSpeech等日语数据集上CER/WER优于原版模型
大规模训练
使用超过720万条日语语音-文本对进行训练

模型能力

日语语音转文本
长音频分段处理
支持Flash Attention 2加速

使用案例

语音转录
电视节目字幕生成
处理日本电视节目音频生成准确字幕
在ReazonSpeech测试集上CER 11.6/WER 55.6
语音助手
为日语语音助手提供快速准确的语音识别能力