实时语音合成
Spark TTS 0.5B GGUF
Spark-TTS-0.5B 是一个基于 prince-canuma/Spark-TTS-0.5B 的量化版本,支持英文和中文的文本转语音任务。
语音合成
支持多种语言
S
mradermacher
318
0
Orpheus
Apache-2.0
基于Llama架构的尖端语音大模型,专为高质量、富有同理心的文本转语音生成而设计
语音合成
Transformers
英语
O
atharva27
20
0
Orpheus 3b 0.1 Ft 16bit
Apache-2.0
基于羊驼模型的尖端语音大语言模型,专为高质量、富有同理心的文本转语音生成而设计
语音合成
Transformers
支持多种语言
O
Prince-1
60
0
Dia 1.6B 6bit
Apache-2.0
Dia-1.6B-6bit 是一个基于 Dia-1.6B 的 6 位量化版本,专为 MLX 框架优化的文本转语音模型。
语音合成
英语
D
mlx-community
76
4
Orpheus Awq
Apache-2.0
Orpheus-3b FT的4位AWQ量化版本,专为文本转语音任务优化,支持语音克隆功能。
语音合成
英语
O
YaTharThShaRma999
48
3
Llama OuteTTS 1.0 1B Bf16
这是一个基于MLX格式的文本转语音模型,支持多种语言,适用于语音合成任务。
语音合成
支持多种语言
L
mlx-community
23
0
Llama OuteTTS 1.0 1B 3bit
这是一个基于MLX格式的3位量化文本转语音模型,支持多种语言。
语音合成
支持多种语言
L
mlx-community
16
0
Kokoro 82M
Apache-2.0
Kokoro是一款拥有8200万参数的开源TTS模型,音质媲美更大模型,同时具备显著的速度优势和成本效益。
语音合成
英语
K
prince-canuma
376
2
Zonos V0.1 Transformer
Apache-2.0
Zonos-v0.1 是一款领先的开源权重文本转语音模型,基于超过20万小时的多语言语音数据训练而成,其表现力和质量可与顶级TTS服务商媲美,甚至更胜一筹。
语音合成
Z
Isi99999
30
0
XTTS V2 Urdu FT
MIT
一个支持乌尔都语文本转语音和语音克隆的TTS模型
语音合成
X
suhaibrashid17
70
3
Tts En Fastpitch
FastPitch是一种完全并行的Transformer架构文本转语音模型,能够控制音高和音素持续时间,生成高质量的英语美式语音。
语音合成
英语
T
nvidia
4,701
38