K

Kb Whisper Medium

由 KBLab 开发
瑞典国家图书馆发布的基于超过5万小时瑞典语音训练的Whisper模型,在瑞典语音识别任务上表现优异
下载量 691
发布时间 : 2/14/2025
模型介绍
内容详情
替代品

模型简介

KB-Whisper是专门针对瑞典语优化的自动语音识别(ASR)模型系列,基于OpenAI的Whisper架构改进,显著提升了瑞典语的识别准确率

模型特点

优化的瑞典语识别
专门针对瑞典语训练,相比OpenAI原版模型平均降低47%的词错误率(WER)
多格式支持
提供Hugging Face、whisper.cpp(GGML)、onnx和ctranslate2等多种格式的检查点
多风格转录
提供三种转录风格选择:简洁的Subtitle版、默认的Stage 2版和详细的Strict版
大规模训练数据
基于超过5万小时的瑞典语音数据训练,分为两个质量阶段

模型能力

瑞典语语音识别
带时间戳的转录
多格式推理支持
批处理转录

使用案例

语音转录
会议记录
将瑞典语会议录音转换为文字记录
相比OpenAI原版模型显著提高准确率
字幕生成
为瑞典语视频内容生成字幕
提供带时间戳的准确转录
语音分析
语音内容分析
分析瑞典语语音内容用于研究或商业智能