H

Heron NVILA Lite 33B

由 turing-motors 开发
Heron-NVILA-Lite-33B 是一款基于 NVILA-Lite 架构、专为日语训练的视觉语言模型,支持日语和英语的多模态任务。
下载量 99
发布时间 : 5/12/2025
模型介绍
内容详情
替代品

模型简介

该模型结合了视觉编码器和大语言模型,能够处理图像和文本的交互任务,特别优化了日语环境下的表现。

模型特点

日语优化
专门针对日语环境训练,在日语视觉语言任务中表现优异
多模态能力
能够同时处理图像和文本输入,实现图文交互
高性能架构
结合了先进的视觉编码器和大语言模型,提供强大的推理能力

模型能力

图像描述生成
视觉问答
多轮图文对话
跨语言理解
图像内容分析

使用案例

内容理解
图像描述生成
为输入的图像生成详细的文字描述
在日语视觉问答500测试中得分3.85/5.0
客户服务
多轮图文对话
支持基于图像的多轮对话交互
在日语VLM野外基准测试中得分4.0/5.0