S

Spaceom GGUF

由 mgonzs13 开发
SpaceOm-GGUF 是一款专注于视觉问答任务的多模态模型,在空间推理方面表现出色。
下载量 196
发布时间 : 6/11/2025

模型简介

SpaceOm-GGUF 是基于特定数据集训练的多模态模型,擅长视觉问答和空间推理任务,可用于图像文本转换。

模型特点

增强的空间推理能力
在 SpaceThinker 基础上改进,通过更长的推理轨迹训练提升空间理解能力
机器人领域优化
使用 Robo2VLM-Reasoning 数据集训练,增强机器人应用场景下的表现
多模态融合
结合视觉和语言处理能力,实现高质量的图像文本转换

模型能力

视觉问答
空间推理
图像描述生成
目标定位
空间关系理解
距离估计

使用案例

机器人导航
空间环境理解
帮助机器人理解周围环境的空间布局
在 SpatialScore 基准测试中目标定位得分 54.00
教育
视觉问答系统
回答关于图像内容的复杂空间问题
在 SpaCE-10 基准测试中目标-目标空间关系得分 50.00
AIbase
智启未来,您的人工智能解决方案智库
简体中文