K

Kotoba Whisper V1.0

由 kotoba-tech 开发
Kotoba-Whisper 是由 Asahi Ushio 和 Kotoba Technologies 合作开发的日语自动语音识别蒸馏版 Whisper 模型集合,比原版 large-v3 快 6.3 倍,同时保持相近的低错误率。
下载量 2,397
发布时间 : 4/14/2024
模型介绍
内容详情
替代品

模型简介

日语自动语音识别模型,基于 Whisper large-v3 蒸馏优化,专注于日语语音转录任务。

模型特点

高效推理
比原版 Whisper large-v3 快 6.3 倍
高准确率
在多个日语测试集上 CER 和 WER 表现接近或优于原版模型
专注日语优化
专门针对日语语音特点进行训练和优化
长音频支持
支持顺序和分块两种长音频转录算法

模型能力

日语语音识别
短音频转录
长音频转录
带时间戳的转录

使用案例

语音转录
日语会议记录
将日语会议录音自动转录为文字
CER 9.4-12.2,WER 56.6-64.3
日语播客字幕生成
为日语播客内容自动生成字幕
支持长音频转录,可生成带时间戳的字幕
语音数据标注
日语语音数据集标注
用于辅助日语语音数据集的标注工作
可作为预标注工具提高标注效率