M

Moondream 2b 2025 04 14 4bit

由 moondream 开发
Moondream是一款轻量级视觉语言模型,专为高效全平台运行而设计。2025年4月14日发布的4比特量化版在保持高精度的同时大幅降低内存占用。
下载量 6,037
发布时间 : 5/20/2025
模型介绍
内容详情
替代品

模型简介

Moondream是一个高效的视觉语言模型,能够处理图像文本生成、视觉问答、目标检测和定位标记等任务。其4比特量化版本通过量化感知训练技术实现了内存占用的大幅缩减。

模型特点

高效量化
采用4比特量化技术,内存占用减少42%,精度仅下降0.6%
全平台兼容
专为高效运行于各种硬件平台设计
多任务支持
支持图像描述生成、视觉问答、目标检测和定位标记等多种任务
高速推理
在Nvidia RTX 3090上达到184词元/秒的生成速度

模型能力

图像描述生成
视觉问答
目标检测
定位标记
流式生成

使用案例

图像理解
自动图像标注
为图像生成简短或标准长度的描述文本
可生成不同长度的图像描述
视觉问答系统
回答关于图像内容的自然语言问题
准确回答如'图中有多少人?'等问题
计算机视觉
目标检测
检测图像中的特定对象
可检测如人脸等特定对象
定位标记
标记图像中特定对象的位置
可标记如人物等对象的位置