S

Smolvlm Instruct

由 mjschock 开发
基于HuggingFaceTB/SmolVLM-Instruct微调的智能视觉语言模型,采用Unsloth和TRL库优化训练速度
下载量 18
发布时间 : 12/24/2024
模型介绍
内容详情
替代品

模型简介

这是一个经过优化的视觉语言模型,专注于指令跟随任务,能够处理视觉和语言结合的输入

模型特点

高效训练
使用Unsloth和TRL库进行训练,速度提升2倍
无延迟优化
针对推理性能进行了优化
指令跟随
专门针对指令跟随任务进行微调

模型能力

文本生成
视觉语言理解
指令跟随

使用案例

智能助手
视觉问答
根据图像内容回答用户问题
图像描述生成
为输入图像生成文字描述
内容生成
多模态内容创作
结合视觉和语言输入生成创意内容