K

Kb Whisper Small

由 KBLab 开发
瑞典国家图书馆发布的Whisper模型,专为瑞典语优化,在50,000+小时瑞典语音数据上训练,性能超越OpenAI原版
下载量 28.61k
发布时间 : 2/14/2025
模型介绍
内容详情
替代品

模型简介

基于OpenAI Whisper架构优化的瑞典语自动语音识别(ASR)模型,显著降低词错误率(WER),支持多种推理格式

模型特点

瑞典语优化
专门针对瑞典语进行优化训练,词错误率比OpenAI原版降低47%
多格式支持
提供Hugging Face、GGML、ONNX和ctranslate2多种推理格式
两阶段训练
采用两阶段训练策略,第一阶段低阈值过滤,第二阶段严格质量过滤
转录风格可选
提供三种转录风格:简洁的字幕版、平衡的标准版和详细的严格版

模型能力

瑞典语语音识别
带时间戳的转录
语音内容分析
多格式推理支持

使用案例

语音转录
会议记录
将瑞典语会议录音自动转录为文字记录
词错误率低至6.4%(CommonVoice数据集)
媒体字幕生成
为瑞典语视频内容自动生成字幕
支持字幕专用优化版本(revision=subtitle)
语音分析
语音内容分析
分析瑞典语语音内容并提取关键信息