多说话人支持
Csm 1b
Apache-2.0
CSM(对话语音模型)是Sesame开发的1B参数语音生成模型,可从文本和音频输入生成RVQ音频编码。
语音合成
Safetensors
英语
C
unsloth
2,667
5
Csm 1b Safetensors Fp16
Apache-2.0
CSM(对话语音模型)是由Sesame开发的10亿参数语音生成模型,可通过文本和音频输入生成RVQ音频编码。
语音合成
Transformers
英语
C
lunahr
79
5
Csm 1b
Apache-2.0
CSM是由Sesame开发的1B参数语音生成模型,可通过文本和音频输入生成RVQ音频编码,支持带上下文的语音生成。
语音合成
Safetensors
英语
C
eustlb
5,144
3
Csm 1b Safetensors Quants
Apache-2.0
CSM(对话语音模型)是Sesame开发的10亿参数语音生成模型,可通过文本和音频输入生成RVQ音频编码。
语音合成
Transformers
英语
C
lunahr
37
7
Csm 1b
Apache-2.0
一个基于PyTorch的文本转语音模型,支持中文语音合成,由SesameAILabs开发并发布。
语音合成
C
nielsr
18
3
Kokoro 82M V1.1 Zh
Apache-2.0
Kokoro 是一个开放权重的小型但功能强大的文本转语音(TTS)模型系列,新增了来自专业数据集的100名中文说话人数据。
语音合成
K
hexgrad
51.56k
112
Yourtts Formosan Only Ithuan
基于阿美语和太鲁阁语的实验性语音合成模型,使用ithuan数据集训练
语音合成
其他
Y
united-link
14
0
F5 TTS Pt Br
基于F5-TTS的巴西葡萄牙语文本转语音模型,支持情感标记和说话者特征控制
语音合成
其他
F
firstpixel
253
36
Yarngpt
Apache-2.0
YarnGPT 是一款专为合成尼日利亚口音英语而设计的文本转语音(TTS)模型,采用纯语言建模技术,可为多样化应用提供高质量、自然且文化相关的语音合成。
语音合成
Transformers
英语
Y
saheedniyi
124
34
Hindi Text To Speech Tts
MIT
基于microsoft/speecht5_tts微调的印地语文本转语音模型
语音合成
Transformers
H
ShigrafS
23
0
Parler Tts Mini V1.1
Apache-2.0
Parler-TTS Mini v1.1 是一个轻量级的文本转语音模型,基于45,000小时的音频数据训练而成,能够生成高质量、自然流畅的语音,其特性可以通过简单的文本提示进行控制。
语音合成
Transformers
英语
P
parler-tts
1,490
19
E2 TTS
F5-TTS 是一个完全非自回归的零样本文本转语音模型,支持高质量的语音合成。
语音合成
E
SWivid
32.58k
48
Speecht5 Tts Tr V1.0
MIT
基于Microsoft SpeechT5微调的土耳其语文本转语音模型,支持生成自然语音
语音合成
Transformers
其他
S
umarigan
959
8
Parler Tts Tiny V1
Apache-2.0
轻量级文本转语音模型,基于4.5万小时音频数据训练,可通过文本提示控制语音特性
语音合成
Transformers
英语
P
parler-tts
67
1
Parler Tts Large V1
Apache-2.0
拥有22亿参数的文本转语音模型,基于4.5万小时音频数据训练,支持通过文本提示控制语音特征
语音合成
Transformers
英语
P
parler-tts
28.69k
252
Parler Tts Mini V1
Apache-2.0
轻量级文本转语音模型,基于4.5万小时音频训练,支持通过文本提示控制语音特征
语音合成
Transformers
英语
P
parler-tts
14.16k
143
Parler Tts Mini Expresso
Apache-2.0
Parler-TTS Mini:Expresso是基于Parler-TTS Mini v0.1在Expresso数据集上微调的轻量级文本转语音模型,支持情感和说话者控制。
语音合成
Transformers
英语
P
parler-tts
1,489
107
Tts Ru Free Hf Vits Low Multispeaker
Apache-2.0
一个支持多说话人的俄语文本转语音模型,可直接处理带标点符号的普通文本,无需预先转换为音素。
语音合成
Transformers
其他
T
utrobinmv
1,021
18
Speecht5 Tts Arabic
MIT
基于微软SpeechT5架构微调的阿拉伯语文本转语音模型,在Hakawati数据集上训练
语音合成
Transformers
阿拉伯语
S
Reyouf
25
3
Matxa Tts Cat Multispeaker
Apache-2.0
基于Matcha-TTS架构的加泰罗尼亚语多说话人文本转语音模型,通过最优传输条件流匹配训练,支持快速高质量语音合成
语音合成
其他
M
projecte-aina
21
2
Tts Vits Ru Hf
这是一个基于VITS架构的俄语文本转语音模型,能够将俄语文本转换为自然语音。
语音合成
Transformers
其他
T
joefox
382
14
Vits Vctk
MIT
VITS是一种端到端语音合成模型,能够根据输入的文本序列预测对应的语音波形。
语音合成
Transformers
V
kakao-enterprise
3,601
13
Vits Ljs
MIT
VITS是一种端到端语音合成模型,能够根据输入文本序列预测对应的语音波形。
语音合成
Transformers
V
kakao-enterprise
1,127
41
Speecht5 Finetuned Facebook Voxpopuli French
MIT
基于microsoft/speecht5_tts模型在voxpopuli法语数据集上微调的文本转语音模型
语音合成
Transformers
S
Sandiago21
71
2
Nvidia Tts En Hifitts Hifigan Ft Fastpitch
HiFiGAN是一种基于GAN的声码器模型,能够从梅尔频谱图生成高质量音频,支持多说话人英语语音合成。
语音合成
英语
N
Mastering-Python-HF
16
0
Speecht5 Tts Common Voice 5 Sv
MIT
基于微软SpeechT5架构微调的瑞典语文本转语音模型,使用Common Voice数据集训练
语音合成
Transformers
其他
S
GreenCounsel
27
1
Amadeus
这是一个基于ESPnet2框架训练的日语文本转语音(TTS)模型,使用VITS架构,由mio在amadeus数据集上训练完成。
语音合成
日语
A
mio
37
85
Kan Bayashi Libritts Xvector Vits
基于ESPnet框架训练的文本转语音模型,使用LibriTTS数据集训练,支持英语语音合成。
语音合成
英语
K
espnet
61
0