K

Kotoba Whisper V2.1

由 kotoba-tech 开发
Kotoba-Whisper-v2.1 是一款基于 Whisper 的日语自动语音识别(ASR)模型,集成了额外的后处理栈,能够自动添加标点符号。
下载量 2,589
发布时间 : 9/17/2024
模型介绍
内容详情
替代品

模型简介

该模型专注于日语语音识别任务,通过整合 punctuators 库实现标点符号的自动添加,提升了转录文本的可读性。

模型特点

标点符号自动添加
通过整合 punctuators 库,模型能够自动为转录文本添加标点符号,提升文本可读性。
优化的日语识别
专门针对日语语音识别进行优化,在多个日语数据集上表现优异。
流水线集成
后处理栈通过流水线无缝整合,简化了使用流程。

模型能力

日语语音识别
自动标点添加
批量处理音频

使用案例

语音转录
会议记录转录
将日语会议录音转换为带标点的文字记录
CER 17.7(CommonVoice 8 测试集)
媒体内容字幕生成
为日语视频内容自动生成带标点的字幕
CER 15.4(JSUT Basic 5000 数据集)