I

Internvl2 5 HiMTok 8B

由 yayafengzi 开发
HiMTok是一个基于InternVL2_5-8B大型多模态模型微调的分层掩码标记学习框架,专注于图像分割任务。
下载量 16
发布时间 : 3/20/2025
模型介绍
内容详情
替代品

模型简介

该模型通过分层掩码标记学习框架,实现了高效的图像分割功能,特别适用于refcoco系列数据集上的任务。

模型特点

分层掩码标记学习
采用分层结构处理图像分割任务,提高分割精度和效率
多模态能力
结合视觉和语言理解能力,支持复杂的图像分割任务
基于大型预训练模型
在InternVL2_5-8B基础上微调,具备强大的特征提取能力

模型能力

图像分割
掩码生成
多模态理解
视觉-语言任务处理

使用案例

计算机视觉
参考图像分割
根据文本描述对图像中的特定区域进行分割
在refcoco系列数据集上表现良好
交互式图像编辑
通过自然语言指令指导图像编辑和修改