H

Heron NVILA Lite 15B

由 turing-motors 开发
Heron-NVILA-Lite-15B 是一款基于 NVILA-Lite 架构、专为日语训练的视觉语言模型,支持日语和英语,具备图文理解和生成能力。
下载量 936
发布时间 : 3/23/2025
模型介绍
内容详情
替代品

模型简介

该模型是一款多模态视觉语言模型,能够处理图像和文本输入,生成文本输出。主要用于日语和英语的图文对话、图像描述等任务。

模型特点

多模态能力
能够同时处理图像和文本输入,实现图文交互
日语优化
专门针对日语进行了训练和优化
高效架构
采用NVILA-Lite架构,平衡性能和效率
多阶段训练
经过三阶段训练过程,提升模型性能

模型能力

图像理解
文本生成
图文对话
多语言支持
多图交替理解

使用案例

图像理解
图像描述
根据输入图像生成描述性文本
能够准确描述图像内容
视觉问答
图像问答
回答关于图像内容的问题
在评测中获得3.82/5分的表现
多模态对话
图文交替对话
处理包含多张图片和文本的复杂对话
能够理解上下文并生成连贯回复