D

Documentcogito

由 Daemontatox 开发
基于unsloth/Llama-3.2-11B-Vision-Instruct进行精调的多模态模型,针对视觉-语言任务优化并增强指令跟随能力,通过Unsloth框架实现2倍训练加速
下载量 73
发布时间 : 1/16/2025
模型介绍
内容详情
替代品

模型简介

本模型结合Unsloth框架与Hugging Face的TRL库,在保持高性能的同时实现高效训练,适用于视觉文本生成、多模态指令跟随等任务

模型特点

高效训练
采用Unsloth框架实现2倍训练速度提升
多模态能力
强化视觉与语言交互处理能力
指令优化
专门优化指令理解与执行能力

模型能力

视觉文本生成
多模态推理
指令跟随
图像描述生成

使用案例

视觉内容分析
图像描述生成
根据输入图像生成详细文字描述
在开放大模型排行榜中指令跟随准确率达50.64%
教育辅助
多模态学习
结合视觉与文本信息进行教学辅助