Q

Qwen2 VL 2B Instruct

由 FriendliAI 开发
Qwen2-VL-2B-Instruct 是一个多模态视觉语言模型,支持图像文本到文本的任务。
下载量 24
发布时间 : 3/17/2025
模型介绍
内容详情
替代品

模型简介

该模型是一个基于 Qwen2-VL-2B 的多模态视觉语言模型,能够处理图像和文本的交互任务。

模型特点

多模态支持
能够同时处理图像和文本输入,实现多模态交互。
指令跟随
支持指令跟随任务,能够根据用户指令生成相应的文本输出。
优化的标记处理
在 tokenizer.json 中添加了缺失的 `<|image_pad|>` 和 `<|video_pad|>` 标记,提高了处理效率。

模型能力

图像文本理解
多模态交互
指令跟随

使用案例

多模态交互
图像描述生成
根据输入的图像生成详细的文本描述。
视觉问答
回答关于输入图像的问题。