S

Speaker Segmentation

由 pyannote 开发
基于pyannote.audio的说话人分割模型,用于检测音频中的说话人变化和语音活动
下载量 182
发布时间 : 3/2/2022
模型介绍
内容详情
替代品

模型简介

该模型专注于说话人分割任务,能够识别音频中不同说话人的语音片段,但不处理说话人日志(speaker diarization)。

模型特点

端到端说话人分割
支持端到端的说话人分割处理,能够识别音频中的说话人变化
重叠语音检测
能够检测重叠的语音片段
语音活动检测
可识别音频中的语音活动区域

模型能力

说话人变化检测
语音活动检测
重叠语音检测
音频分割

使用案例

语音分析
会议记录分析
分析会议录音中的不同发言者片段
可准确分割不同发言者的语音片段
访谈转录
为访谈录音分割不同说话人的语音
便于后续的转录和内容分析