C

Cogview4 6B

由 THUDM 开发
CogView4-6B 是一个基于 GLM-4-9B 基础模型的文生图模型,支持中文和英文,能够生成高质量的图像。
下载量 333.85k
发布时间 : 3/3/2025
模型介绍
内容详情
替代品

模型简介

CogView4-6B 是一个高性能的文生图模型,能够根据文本提示生成高质量的图像,支持多种分辨率和复杂的文本描述。

模型特点

高分辨率支持
支持宽高在 512px 至 2048px 之间的多种分辨率,且总像素不超过 2^21 像素。
低显存优化
通过模型 CPU 卸载和文本编码器 4bit 量化等技术,显著降低显存占用。
中文文本准确率高
在中文文本准确率评估中,F1 值达到 0.6168,显著优于其他模型。

模型能力

文本生成图像
高分辨率图像生成
多语言支持(中文、英文)

使用案例

创意设计
跑车设计
根据详细的文本描述生成高质量的跑车图像。
生成图像具有高度的细节和逼真度,能够准确还原文本描述的属性。
广告与营销
产品展示
根据产品描述生成吸引人的产品展示图像。
生成的图像能够突出产品的关键特性和卖点。