C

Crisperwhisper

由 unsloth 开发
CrisperWhisper是OpenAI Whisper的进阶版本,专为快速、精准且逐字记录的语音识别设计,提供准确(清晰)的词级时间戳。
下载量 50
发布时间 : 5/14/2025
模型介绍
内容详情
替代品

模型简介

CrisperWhisper是Whisper的改进版本,旨在精确转录每一个口语词汇,包括填充词、停顿、结巴和错误起始,提供更准确的词级时间戳。

模型特点

精确词级时间戳
通过调整分词器及训练中定制注意力损失,提供精确时间戳,即使在不流畅和停顿处也能准确标记。
逐字转录
如实转录每个口语词汇,区分并记录如'um'和'uh'等填充词。
填充词检测
准确检测并转录填充词。
减少幻觉
最小化转录幻觉,提升准确性。

模型能力

语音识别
词级时间戳生成
填充词检测
多语言支持

使用案例

语音转录
会议记录
精确记录会议中的每一个词汇,包括停顿和填充词。
提供更完整的会议记录,便于后期分析。
访谈转录
转录访谈内容,保留所有口语特征。
更真实的访谈记录,便于研究口语表达。
语音分析
口语分析
分析口语中的填充词和停顿模式。
帮助语言学家研究口语特征。