D

Deepseer R1 Vision Distill Qwen 1.5B Google Vit Base Patch16 224

由 mehmetkeremturkcan 开发
DeepSeer是基于DeepSeek-R1模型开发的视觉语言模型,支持思维链推理能力,通过对话模板训练视觉模型。
下载量 25
发布时间 : 1/30/2025
模型介绍
内容详情
替代品

模型简介

DeepSeer是一个结合视觉和语言处理能力的模型,具备思维链推理功能,能够处理图像到文本的转换任务。

模型特点

思维链推理能力
支持通过对话模板进行思维链推理,增强模型的解释和推理能力
视觉语言结合
结合视觉和语言处理能力,能够理解和生成与图像相关的文本
基于DeepSeek-R1
基于DeepSeek-R1-Distill-Qwen-1.5B模型进行微调,继承了其强大的语言处理能力

模型能力

图像理解
文本生成
思维链推理
视觉问答

使用案例

教育
视觉问答系统
用于教育场景中的视觉问答,帮助学生理解图像内容
提供详细的解释和推理过程
研究
视觉语言模型研究
用于研究视觉语言模型的推理能力和性能
提供思维链推理的案例研究