K

Kb Whisper Large

由 KBLab 开发
瑞典国家图书馆发布的基于Whisper架构的瑞典语语音识别模型,训练数据超过5万小时,显著降低词错误率。
下载量 8,880
发布时间 : 2/14/2025
模型介绍
内容详情
替代品

模型简介

专为瑞典语优化的语音识别模型,基于OpenAI Whisper架构,在多个瑞典语数据集上表现优异。

模型特点

显著降低词错误率
相比OpenAI原版模型,在瑞典语识别上平均降低47%的词错误率(WER)
多格式支持
提供Hugging Face、whisper.cpp(GGML)、onnx和ctranslate2多种格式的模型检查点
多版本转录风格
提供三种转录风格版本:字幕版(简洁)、标准版(默认)和严格版(逐字逐句)
大规模训练数据
基于超过5万小时的瑞典语音数据训练,分两个质量阶段进行训练

模型能力

瑞典语语音识别
带时间戳的语音转录
多格式推理支持
批处理语音转录

使用案例

语音转录
会议记录转录
将瑞典语会议录音转换为文字记录
高准确率的转录文本
字幕生成
为瑞典语视频内容生成字幕
带时间戳的字幕文件
语音分析
语音内容分析
分析瑞典语语音内容进行后续处理
结构化文本数据