H

Heron Chat Git ELYZA Fast 7b V0

由 turing-motors 开发
一个能够对输入图像进行对话的视觉语言模型,支持日语交互
下载量 17
发布时间 : 9/6/2023
模型介绍
内容详情
替代品

模型简介

该模型基于GIT架构,结合ELYZA日语Llama-2 7B快速指令版语言模型,能够处理图像并生成相关文本描述或回答关于图像的问题

模型特点

视觉语言理解
能够理解图像内容并进行相关对话
日语优化
专门针对日语进行训练和优化
多阶段训练
先使用STAIR日文图说数据集训练,再使用LLaVA日语指令数据集和日语视觉基因组微调

模型能力

图像描述生成
视觉问答
日语对话

使用案例

聊天应用
图像内容问答
用户上传图片并询问相关问题,模型生成回答
能够准确识别常见图像内容并回答问题
辅助工具
图像内容描述
为视障人士提供图像内容描述