P

Paligemma Longprompt V1 Safetensors

由 mnemic 开发
实验性视觉模型,融合关键词标签与长文本描述生成图像提示词
下载量 38
发布时间 : 6/15/2024
模型介绍
内容详情
替代品

模型简介

该模型是基于超长复杂结构生成图像描述的视觉语言模型,能同时输出逗号分隔关键词和自然语言长文本描述,适用于图像内容分析与生成提示词创作。

模型特点

混合输出格式
同时生成图库式标签(逗号分隔关键词)和自然语言长文本描述
复杂结构处理
专门优化对超长复杂描述结构的生成能力
双用途输出
生成的标签和描述均可直接用于图像生成提示词

模型能力

图像内容分析
关键词提取
自然语言描述生成
图像提示词创作

使用案例

创意辅助
AI绘画提示词生成
为AI绘画工具生成包含关键词和详细描述的提示词
示例输出包含20+关键词和100+单词的连贯描述
内容标注
图像库自动标注
为图像库自动生成可搜索的标签和描述文本
同时提供可检索关键词和可读性描述