K

Kotoba Whisper V2.2

由 kotoba-tech 开发
基于Whisper的日语自动语音识别模型,集成说话人分离和标点符号添加功能
下载量 22.80k
发布时间 : 10/18/2024
模型介绍
内容详情
替代品

模型简介

Kotoba-Whisper-v2.2是一个日语自动语音识别(ASR)模型,基于Whisper架构开发,增加了说话人分离和标点符号添加的后处理功能。

模型特点

说话人分离
集成diarizers技术,能够识别并分离不同说话人的语音内容
自动标点
使用punctuators技术为转录文本自动添加标点符号
高效推理
支持Flash Attention 2加速,提高GPU上的推理效率

模型能力

日语语音识别
多说话人分离
自动标点添加
长音频处理

使用案例

会议记录
多说话人会议转录
自动识别会议中不同发言人的语音内容并生成带标点的文字记录
可区分不同说话人并生成格式化的会议记录
访谈记录
访谈内容转录
将访谈录音转换为文字,自动区分采访者和受访者的发言
生成带说话人标识和标点的访谈记录