W

Whisper Medicalv1

由 Crystalcareai 开发
Distil-Whisper是Whisper large-v3的知识蒸馏版本,专注于英语语音识别,提供更快的推理速度同时保持接近原始模型的准确性。
下载量 348
发布时间 : 4/28/2024
模型介绍
内容详情
替代品

模型简介

这是一个针对英语语音识别优化的蒸馏模型,基于OpenAI的Whisper large-v3,通过大规模伪标签知识蒸馏技术训练,特别优化了长格式音频转录的准确性。

模型特点

高效推理
比原始Whisper large-v3快6.3倍,比前代distil-large-v2快1.1倍
优化的长格式转录
专门调整以在使用顺序长格式算法时提供更优的长格式转录准确性
兼容主流库
设计为与Whisper cpp、Faster-Whisper和OpenAI Whisper等流行库兼容
知识蒸馏
通过大规模伪标签知识蒸馏技术训练,保持接近原始模型的性能

模型能力

英语语音识别
短格式音频转录(<30秒)
长格式音频转录(>30秒)
支持顺序和分块两种长格式转录算法
提供分段级时间戳

使用案例

语音转录
会议记录转录
将会议录音转换为文字记录
准确率高,特别适合长格式会议录音
播客转录
将播客音频内容转换为文字
快速处理长音频,保持高准确性
媒体处理
视频字幕生成
为视频内容自动生成字幕
高效处理长视频内容