高质量图像生成

# 高质量图像生成

Kontext Style Loras

为FLUX.1 Kontext模型提供20多种艺术和卡通风格的LoRA适配器，实现高质量的图像到图像生成。

图像生成英语

Nunchaku Flux.1 Schnell

Nunchaku量化的FLUX.1-schnell模型，用于根据文本提示生成高质量图像，经过优化以实现高效推理。

图像生成英语

通过策略性数据增强方法在小规模精选数据集上训练的文本生成图像模型，显著提升生成质量

文本生成图像

Noob Sdxl Controlnet Manga Line

基于稳定扩散XL（Stable Diffusion XL）的文本生成图像模型，支持通过控制网络实现精细化图像生成。

图像生成英语

VILA-U是一个统一处理视觉语言理解与生成任务的基础模型，通过单一自回归框架实现高效的多模态处理。

文本生成图像

Emu3是由北京智源研究院开发的多模态模型，仅通过预测下一个标记训练而成，支持图像、文本和视频处理。

文本生成图像

Emu3 VisionTokenizer

Emu3是仅通过下一词元预测训练的全新多模态模型套件，在生成与感知任务中均超越多个专业模型

文本生成图像

可图(Kolors)是快手可图团队自研的大规模文生图潜空间扩散模型，在生成图像视觉质量、复杂语义还原度、中英文字体渲染等方面表现优异。

文本生成图像支持多种语言

Midjourney Mini

Midjourney-mini是一款免费的人工智能模型，能够根据文本描述生成逼真图像。

图像生成支持多种语言

基于Stable Diffusion 1.5训练的Openjourney微调模型，使用超过60,000张图像进行训练，优化了图像生成质量。

Ddpm Ema Celebahq 256

DDPM是一种基于扩散概率模型的高质量图像生成模型，受非平衡热力学启发，通过渐进式去噪过程生成图像。

Ddpm Celebahq 256

基于扩散概率模型的高质量图像生成模型，在无条件图像生成任务中表现优异

基于扩散概率模型的高质量图像生成模型，在无条件图像生成任务中表现优异

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24