G

Glm Edge V 2b

由 THUDM 开发
GLM-Edge-V-2B是一个基于Pytorch框架的图像文本到文本模型,支持中文处理。
下载量 23.43k
发布时间 : 11/24/2024
模型介绍
内容详情
替代品

模型简介

该模型主要用于处理图像与文本结合的输入,生成相应的文本输出,适用于多模态任务。

模型特点

多模态处理
能够同时处理图像和文本输入,生成相应的文本输出。
中文支持
专门针对中文文本和图像内容进行优化。
基于GLM架构
采用GLM架构,具有高效的推理性能。

模型能力

图像描述生成
多模态文本生成
中文文本处理

使用案例

图像理解
图像描述生成
根据输入的图像生成对应的文字描述。
生成准确描述图像内容的文本
多模态交互
图像问答
结合图像和文本问题生成回答。
提供与图像内容相关的准确回答