H

Heron Chat Git Ja Stablelm Base 7b V0

由 turing-motors 开发
Heron GIT Japanese StableLM Base 7B 是一个能够就输入图像进行对话的视觉语言模型。
下载量 57
发布时间 : 9/6/2023
模型介绍
内容详情
替代品

模型简介

该模型是一个视觉语言模型,能够根据输入的图像进行对话,主要用于日语环境下的图像理解和问答任务。

模型特点

日语视觉语言理解
专门针对日语环境优化的视觉语言模型,能够理解图像内容并用日语进行描述和问答。
两阶段训练
先在STAIR Captions上进行预训练,然后在LLaVA-Instruct-150K-JA和Japanese Visual Genome上进行微调。
基于StableLM
使用Japanese StableLM Base Alpha作为语言模型基础,具有良好的日语理解和生成能力。

模型能力

图像描述生成
视觉问答
日语对话
图像内容理解

使用案例

聊天应用
图像对话机器人
用户上传图片后,模型可以就图片内容进行对话和问答。
能够生成与图片内容相关的日语回答。
研究
视觉语言模型研究
可用于日语环境下视觉语言理解的研究和实验。