W

Whisper Large V3 Speech Flow

由 tiantiaf 开发
基于Whisper Large v3的语音流畅度分类模型,可检测语音流畅度及不流畅类型
下载量 157
发布时间 : 5/22/2025
模型介绍
内容详情
替代品

模型简介

该模型实现了语音流畅度分类方法,首先检测语音是否流畅,若不流畅则进一步分类不流畅类型(阻塞、延长、声音重复、词语重复、插入语)。

模型特点

流畅度检测
能够准确区分流畅和不流畅的语音片段
不流畅类型分类
对不流畅语音可进一步分类为5种具体类型
窗口化处理
采用3秒窗口大小和1秒步长处理长语音

模型能力

语音流畅度检测
不流畅类型分类
长语音分段处理

使用案例

语音治疗
口吃评估
帮助语言治疗师评估患者的口吃严重程度和类型
可量化分析不流畅语音的频率和类型分布
语音质量分析
语音流畅度评分
为语音质量评估系统提供流畅度指标
自动生成语音流畅度报告