N

Nanollava 1.5

由 qnguyen3 开发
nanoLLaVA-1.5是一款参数规模在10亿以下的视觉语言模型,专为边缘设备设计,小巧但功能强大。
下载量 442
发布时间 : 6/29/2024
模型介绍
内容详情
替代品

模型简介

nanoLLaVA-1.5是对v1.0版本的升级,是一款高效的视觉语言模型,适用于图像文本到文本的任务。

模型特点

小巧但强大
专为边缘设备设计,参数规模在10亿以下,但功能强大。
多模态支持
支持视觉和语言的多模态任务处理。
高效推理
优化后的模型在边缘设备上也能高效运行。

模型能力

图像描述生成
视觉问答
多模态推理

使用案例

视觉问答
图像内容描述
根据图像生成详细的文字描述。
教育
科学问题解答
基于图像的科学问题解答。