Qwen2.5 Omni 7B AWQ
其他
Qwen2.5-Omni是一款端到端多模态模型,能够感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。
多模态融合
Transformers

英语
Q
Qwen
77
8
Spark TTS 0.5B 8bit
这是一个基于MLX格式的文本转语音模型,支持英文和中文,由prince-canuma/Spark-TTS-0.5B转换而来。
语音合成
支持多种语言
S
mlx-community
56
1
Spark TTS 0.5B 4 6bit
Spark-TTS-0.5B-4-6bit 是一个基于 MLX 格式的文本转语音模型,支持英文和中文。
语音合成
支持多种语言
S
mlx-community
59
0
Spark TTS 0.5B Bf16
Spark-TTS-0.5B-fp16 是一个基于 MLX 格式的文本转语音模型,支持英文和中文。
语音合成
支持多种语言
S
mlx-community
121
0
Muyan TTS SFT Q8 0 GGUF
该模型是基于MYZY-AI/Muyan-TTS-SFT转换的GGUF格式文本转语音模型,支持中文语音合成。
语音合成
M
NikolayKozloff
20
1
Kokorotts
Apache-2.0
Kokoro是一款拥有8200万参数的开源文本转语音模型,以轻量架构提供媲美大型模型的音质,同时显著提升速度和成本效益。
语音合成
英语
K
Daemontatox
78
0
Kokoro 82M V1.1 Zh
Apache-2.0
Kokoro 是一个开放权重的小型但功能强大的文本转语音(TTS)模型系列,新增了来自专业数据集的100名中文说话人数据。
语音合成
K
hexgrad
51.56k
112
Kokoro 82M Light
Apache-2.0
基于StyleTTS2-LJSpeech的克隆版本,针对英语文本转语音任务进行了优化,移除了部分依赖项以简化部署。
语音合成
英语
K
ctranslate2-4you
21
8
Llasa 1B Q8 0 GGUF
该模型是从HKUST-Audio/Llasa-1B转换而来的GGUF格式模型,主要用于文本转语音任务。
语音合成
支持多种语言
L
NikolayKozloff
16
3
Outetts 0.3 1B GGUF
OuteTTS-0.3-1B是由OuteAI开发的多语言文本转语音模型,支持英语、中文、日语、韩语、法语和德语。
语音合成
支持多种语言
O
gaianet
34
0
Outetts 0.3 1B GGUF
OuteTTS-0.3-1B 是一个支持多语言的文本转语音模型,由 OuteAI 开发,Second State Inc. 进行了量化处理。
语音合成
支持多种语言
O
second-state
151
1
Outetts 0.3 500M GGUF
OuteTTS-0.3-500M 是一个多语言文本转语音模型,支持英语、中文、日语、韩语、法语和德语。
语音合成
支持多种语言
O
second-state
49
1
Outetts 0.2 500M GGUF
OuteTTS-0.2-500M 是由 OuteAI 开发的多语言文本转语音模型,支持英语、中文、日语和韩语。
语音合成
支持多种语言
O
gaianet
44
0
Outetts 0.2 500M GGUF
OuteTTS-0.2-500M 是一个多语言文本转语音模型,支持英语、中文、日语和韩语。
语音合成
支持多种语言
O
second-state
693
0
Fish Speech 1.5 Base
MIT
Fish Speech 1.5 是一个多语言文本转语音模型,支持多种语言,无需访问令牌即可使用。
语音合成
支持多种语言
F
None1145
111
4
Hindi Text To Speech Tts
MIT
基于microsoft/speecht5_tts微调的印地语文本转语音模型
语音合成
Transformers

H
ShigrafS
23
0
XTTS V2 Argentinian Spanish
其他
ⓍTTS是一款语音生成模型,仅需6秒的音频片段即可克隆声音并应用于不同语言。
语音合成
西班牙语
X
marianbasti
44
5
Mms Tts Nova Train
CC
这是一个掸语(Shan)的文本转语音(TTS)模型,用于将掸语文本转换为自然语音。
语音合成
Transformers

其他
M
NorHsangPha
28
0
Speecht5 Tts Commonvoice Ca
MIT
基于SpeechT5架构的加泰罗尼亚语文本转语音模型,在Common Voice 11.0数据集上微调
语音合成
Transformers

其他
S
wetdog
22
0
Tts Hifigan
HiFiGAN是一种生成对抗网络(GAN)模型,能够从梅尔频谱图生成高质量音频,适用于文本转语音系统。
语音合成
英语
T
nvidia
5,022
36
Hifigan Lj V1
基于LJ Speech数据集训练的HiFi-GAN声码器模型,用于高质量语音合成
语音合成
Transformers

英语
H
jaketae
32
0
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文