说话人分割

# 说话人分割

Pyannote Segmentation 30

这是一个用于音频处理的说话人分割模型，能够检测语音活动、重叠语音和多个说话人。

说话人处理

Speaker Diarization Optimized

Pyannote.audio的说话人分割管道，用于自动检测音频中的说话人变化和分割语音片段

说话人处理

Segmentation 3.0

这是一个基于幂集编码的说话人分割模型，能够处理10秒音频片段并识别多个说话人及其重叠语音。

说话人处理

Pyannote Speaker Diarization Endpoint

基于pyannote.audio 2.0版本的说话人分割模型，用于自动检测和分割音频中的不同说话人

说话人处理

Pyannote Segmentation

这是一个端到端的说话人分割模型，支持语音活动检测、重叠语音检测和重分割任务。

说话人处理

Speaker Segmentation

基于pyannote.audio的说话人分割模型，用于检测音频中的说话人变化和语音活动

说话人处理

Overlapped Speech Detection

一个用于检测音频中重叠语音的预训练模型，能够识别两个或更多说话人同时活跃的时间段。

说话人处理

Speaker Diarization

基于pyannote.audio 2.1.1版本的说话人分割模型，用于自动检测音频中的说话人变化和重叠语音

说话人处理

一个用于语音活动检测、重叠语音检测和说话人分割的音频处理模型

说话人处理

Voice Activity Detection

基于pyannote.audio 2.1版本的语音活动检测模型，用于识别音频中的语音活动时间段

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24