L

Llama 3.2 11B Vision Radiology Mini

由 p4rzvl 开发
这是一个基于Llama架构的多模态模型,支持视觉和文本指令,经过4位量化优化。
下载量 69
发布时间 : 4/17/2025
模型介绍
内容详情
替代品

模型简介

该模型结合了视觉和语言理解能力,能够处理图像到文本的转换任务,适用于多模态交互场景。

模型特点

多模态支持
能够同时处理视觉和文本输入,实现图像到文本的转换。
4位量化优化
通过4位量化技术减少模型大小和计算资源需求。
指令跟随
能够理解和执行基于视觉和文本的复杂指令。

模型能力

图像理解
文本生成
多模态推理
指令跟随

使用案例

多模态交互
图像描述生成
根据输入的图像生成详细的文字描述。
视觉问答
回答关于图像内容的自然语言问题。
内容创作
图文内容生成
基于图像生成相关的文本内容,如社交媒体帖子或文章。