说话人分割
Pyannote Segmentation 30
MIT
这是一个用于音频处理的说话人分割模型,能够检测语音活动、重叠语音和多个说话人。
说话人处理
P
collinbarnwell
873
0
Speaker Diarization Optimized
MIT
Pyannote.audio的说话人分割管道,用于自动检测音频中的说话人变化和分割语音片段
说话人处理
S
G-Root
349
0
Segmentation 3.0
MIT
这是一个基于幂集编码的说话人分割模型,能够处理10秒音频片段并识别多个说话人及其重叠语音。
说话人处理
S
pyannote
12.6M
445
Pyannote Speaker Diarization Endpoint
MIT
基于pyannote.audio 2.0版本的说话人分割模型,用于自动检测和分割音频中的不同说话人
说话人处理
P
KIFF
1,830
4
Pyannote Segmentation
MIT
这是一个端到端的说话人分割模型,支持语音活动检测、重叠语音检测和重分割任务。
说话人处理
P
philschmid
427
9
Speaker Segmentation
MIT
基于pyannote.audio的说话人分割模型,用于检测音频中的说话人变化和语音活动
说话人处理
S
pyannote
182
33
Overlapped Speech Detection
MIT
一个用于检测音频中重叠语音的预训练模型,能够识别两个或更多说话人同时活跃的时间段。
说话人处理
O
pyannote
144.68k
35
Segmentation
MIT
一个用于语音活动检测、重叠语音检测和说话人分割的音频处理模型
说话人处理
S
pyannote
9.2M
579
Speaker Diarization
MIT
基于pyannote.audio 2.1.1版本的说话人分割模型,用于自动检测音频中的说话人变化和重叠语音
说话人处理
S
pyannote
910.93k
1,038
Voice Activity Detection
MIT
基于pyannote.audio 2.1版本的语音活动检测模型,用于识别音频中的语音活动时间段
语音识别
V
pyannote
7.7M
181