Orpheus 3b Kaya Q8 0.gguf
Apache-2.0
基于Canopy Labs预训练模型微调的8位量化文本转语音模型,支持英语24kHz音频生成
语音合成
支持多种语言
O
lex-au
38
0
Orpheus TTS Turkish PT 2000 GGUF
MIT
Orpheus-TTS-Turkish-PT-2000 是一个基于土耳其语的文本转语音(TTS)模型,支持高质量的语音合成。
语音合成
其他
O
Karayakar
45
1
Kokoro V1 0
Apache-2.0
Kokoro是一款拥有8200万参数的开源文本转语音模型,以轻量架构实现媲美大型模型的音质,同时提升生成速度并降低计算成本。
语音合成
英语
K
kiriyamaX
18
1
Fish Speech 1.4
基于70万小时多语言音频数据训练的领先文本转语音(TTS)模型
语音合成
支持多种语言
F
audo
24
2
Parler Tts Large V1
Apache-2.0
拥有22亿参数的文本转语音模型,基于4.5万小时音频数据训练,支持通过文本提示控制语音特征
语音合成
Transformers

英语
P
parler-tts
28.69k
252
Vocos Mel Hifigan Compat 44100khz
MIT
Vocos 是一款快速神经声码器,通过生成频谱系数实现高效音频重建,特别适用于文本转语音任务。
语音合成
TensorBoard

其他
V
patriotyk
2,222
10
Voicecraft 330M TTSEnhanced
VoiceCraft 是一个基于 PyTorch 的文本转语音模型,支持高质量的语音合成。
语音合成
V
pyp1
105
1
Voicecraft 830M TTSEnhanced
VoiceCraft 是一个基于 PyTorch 的文本转语音模型,支持高质量的语音合成。
语音合成
Safetensors
V
pyp1
148
8
Voicecraft Giga330m
VoiceCraft 是一个基于 PyTorch 的文本转语音模型,支持高质量的语音合成。
语音合成
V
pyp1
1,188
0
Nvidia Tts En Hifitts Hifigan Ft Fastpitch
HiFiGAN是一种基于GAN的声码器模型,能够从梅尔频谱图生成高质量音频,支持多说话人英语语音合成。
语音合成
英语
N
Mastering-Python-HF
16
0
Fastspeech2 Conformer
Apache-2.0
FastSpeech2Conformer是一个非自回归的文本转语音(TTS)模型,结合了FastSpeech2和Conformer架构的优势,能够快速高效地从文本生成高质量的语音。
语音合成
Transformers

英语
F
espnet
2,440
6
Persian Tts Female Glow Tts
基于CoquiTTS框架的波斯语女性语音文本转语音模型,使用glow_tts架构训练
语音合成
PyTorch
其他
P
Kamtera
107
10
Amadeus
这是一个基于ESPnet2框架训练的日语文本转语音(TTS)模型,使用VITS架构,由mio在amadeus数据集上训练完成。
语音合成
日语
A
mio
37
85
Tts Hifigan
HiFiGAN是一种生成对抗网络(GAN)模型,能够从梅尔频谱图生成高质量音频,适用于文本转语音系统。
语音合成
英语
T
nvidia
5,022
36
Kss Tts Train Jets Raw Phn Null G2pk Train.total Count.ave
这是一个基于ESPnet2框架训练的韩语文本转语音(TTS)模型,使用KSS数据集训练,采用JETS架构。
语音合成
韩语
K
imdanboy
60
0
Jets
基于ESPnet框架训练的JETS文本转语音模型,使用LJSpeech数据集训练,支持英文语音合成。
语音合成
英语
J
imdanboy
15
3
Gunnarthor Talromur A Fastspeech2
基于ESPnet框架和talromur数据集训练的FastSpeech2文本转语音模型,支持冰岛语语音合成。
语音合成
英语
G
espnet
50
0
Kan Bayashi Jvs Tts Finetune Jvs001 Jsut Vits Raw Phn Jaconv Pyopenjta Truncated 178804
这是一个基于ESPnet框架训练的日语文本转语音(TTS)模型,使用jvs数据集进行微调,支持高质量的日语语音合成。
语音合成
日语
K
espnet
19
1
Kan Bayashi Ljspeech Tacotron2
基于ESPnet框架训练的Tacotron2文本转语音模型,使用LJSpeech数据集
语音合成
英语
K
espnet
40
3
Fastspeech2 En Ljspeech
基于FastSpeech 2架构的英语文本转语音模型,使用LJSpeech数据集训练,支持单说话人女声合成。
语音合成
英语
F
facebook
1,521
270
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文