合成数据增强
Sauerkrauttts Preview 0.1 Q4 K M GGUF
SauerkrautTTS-Preview-0.1 是一款基于强大模型微调的德语文本转语音(TTS)模型,提供四种独特的德语发音人声。
语音合成
德语
S
VAGOsolutions
300
4
Gemma 3 Glitter 12B
基于Gemma 3 12B IT的创意写作模型,融合角色扮演和长篇创意写作能力
大型语言模型
Transformers
G
allura-org
216
15
Cockatiel 13B
基于VILA-v1.5-13B开发的视频文本生成模型,能够为输入视频生成精细的描述文本,符合人类偏好。
视频生成文本
Transformers
C
Fr0zencr4nE
26
2
Muffakir Embedding
基于埃及法律书籍和合成数据训练的阿拉伯语句子转换器,专为语义文本相似度和信息检索任务优化。
文本嵌入
阿拉伯语
M
mohamed2811
332
1
Aerogen
Apache-2.0
AeroGen 是首个同时支持水平与旋转边界框条件生成的模型,能够生成满足特定布局和物体类别要求的高质量合成图像。
图像生成
Transformers
英语
A
Sonetto702
0
2
Coreml Depth Anything V2 Small
Apache-2.0
Depth Anything V2 是基于 DPT 架构的深度估计模型,采用 DINOv2 骨干网络,通过大规模合成和真实数据训练,实现精细且鲁棒的深度预测。
3D视觉
C
apple
67
58
Gliner Medium News V2.1
Apache-2.0
基于GLiNER的微调版本,专为新闻实体抽取优化,在18个基准测试中零样本准确率最高提升7.5%
序列标注
英语
G
EmergentMethods
532.81k
75
Meerkat 7b V1.0
猫鼬-7B-v1.0是指令调优的医疗AI系统,首次在所有7B参数模型中突破了美国医师执照考试(USMLE)60%的及格线。
大型语言模型
Transformers
M
dmis-lab
5,069
21
Wav2vec2 Xls R 300m Bangla Command Synthetic
Apache-2.0
基于wav2vec2-xls-r-300m架构的孟加拉语语音识别模型,针对特定命令集进行了微调
语音识别
Transformers
W
sshasnain
17
0