C

Crisperwhisper

由 nyrahealth 开发
CrisperWhisper 是 OpenAI Whisper 的高级变体,专为快速、精确且逐字的语音识别设计,提供准确(清晰)的词级时间戳。
下载量 10.23k
发布时间 : 8/29/2024
模型介绍
内容详情
替代品

模型简介

CrisperWhisper 是 OpenAI Whisper 的高级变体,专为快速、精确且逐字的语音识别设计,提供准确(清晰)的词级时间戳。与原始 Whisper 倾向于省略不流畅部分并采用更偏向意译的转录风格不同,CrisperWhisper 旨在精确转录每一个口语词汇,包括填充词、停顿、口吃和错误的开头。

模型特点

精确的词级时间戳
通过调整分词器并在训练中使用自定义注意力损失,即使在处理不流畅和停顿时也能提供精确的时间戳。
逐字转录
准确转录每一个口语词汇,包括并区分填充词如“um”和“uh”。
填充词检测
检测并准确转录填充词。
减少幻觉
最小化转录中的幻觉,提高准确性。

模型能力

语音识别
词级时间戳生成
填充词检测
多语言支持

使用案例

语音转录
会议记录
用于精确记录会议内容,包括所有不流畅部分和填充词。
提供逐字转录和精确的时间戳。
学术研究
用于转录访谈和研究数据,确保所有口语细节被准确记录。
高准确率的逐字转录。
语音分析
语音行为分析
分析说话者的不流畅模式和填充词使用情况。
提供详细的语音行为数据。