Sdart Synesthesia
这是一个基于Stable Diffusion 1.5的文本生成图像模型,专注于表现联觉(感官混合)的艺术效果。
下载量 21
发布时间 : 4/9/2023
模型简介
该模型旨在捕捉联觉(感官异常混合)的视觉表现,允许用户探索声音、色彩和质感在图像中的交汇效果。
模型特点
联觉艺术表现
专门设计用于表现联觉现象,将多种感官体验融合为视觉艺术
社区创作整合
整合了Stable Diffusion Discord社区'每周图片'比赛的39个参赛作品
低学习率训练
采用较低学习率训练,避免简单复制原始创作,保留多样性
模型能力
文本生成图像
图像生成图像
艺术创作
联觉效果可视化
使用案例
艺术创作
联觉艺术生成
将声音、味道等非视觉感官体验转化为视觉艺术作品
产生富有想象力的联觉效果图像
概念艺术创作
为音乐、文学等艺术作品创作配套视觉内容
实现跨感官的艺术表达
教育演示
联觉现象演示
帮助理解联觉这种神经现象
直观展示感官混合的视觉表现
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2