说话人识别

# 说话人识别

Moonshine是由Useful Sensors开发的自动语音识别(ASR)模型系列，专为英文语音转录设计，在资源受限平台上表现优异。

Transformers 英语

Wespeaker Voxceleb Resnet34 LM

基于ResNet34架构的说话人嵌入模型，经过大间隔微调，在VoxCeleb2数据集上训练，支持说话人识别和相似度计算等任务。

说话人处理英语

Wespeaker Voxceleb Resnet293 LM

基于ResNet293架构的说话人嵌入模型，经过大间隔微调优化，支持说话人识别、相似度计算和语音分割等任务

说话人处理英语

Wav2vec2 Base Superb Sid

基于Wav2Vec2-base预训练模型，在VoxCeleb1数据集上微调的说话人识别模型，用于语音分类任务

说话人处理

Transformers 英语

Spkrec Xvect Voxceleb

这是一个使用SpeechBrain预训练的TDNN模型，用于提取说话人嵌入向量，主要应用于说话人验证和识别任务。

说话人处理英语

Wav2vec2 Large Superb Sid

基于 Wav2Vec2-Large 架构的说话人识别模型，在 VoxCeleb1 数据集上训练，用于将语音按说话人身份分类

说话人处理

Transformers 英语

Hubert Large Superb Sid

基于Hubert-Large架构的说话人识别模型，在VoxCeleb1数据集上训练，用于语音分类任务

说话人处理

Transformers 英语

Hubert Base Superb Sid

基于Hubert的说话人识别模型，针对SUPERB基准任务优化

说话人处理

Transformers 英语

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24