Q

QVQ 72B Preview GGUF

由 XelotX 开发
QVQ-72B-Preview是基于llamacpp的imatrix量化版本的多模态大语言模型,支持图像和文本的多模态理解与生成。
下载量 288
发布时间 : 12/26/2024

模型简介

该模型是QwenVL系列的多模态大语言模型,能够处理图像和文本的联合输入,执行视觉问答、图像描述等任务。

模型特点

多种量化类型
提供从Q8_0到IQ1_M等多种量化类型,满足不同硬件配置下的性能和质量需求。
在线重打包
部分量化类型支持在线重打包,可根据硬件情况自动优化性能。
多模态支持
能够同时处理图像和文本输入,执行视觉问答等任务。
性能优化
通过合理选择量化类型和配置,可在不同硬件上实现性能的优化。

模型能力

视觉问答
图像描述生成
多模态理解
文本生成

使用案例

视觉问答
手指数数
识别图像中手部的数量并回答问题
准确识别图像中的手指数量
图像理解
场景描述
生成对输入图像的详细描述
生成准确且详细的图像描述
AIbase
智启未来,您的人工智能解决方案智库
简体中文