F

Fintor GUI S2

由 Fintor 开发
Fintor-GUI-S2 是一个基于 UI-TARS-7B-DPO 微调的 GUI 基础模型,专注于图形用户界面(GUI)的多模态任务。
下载量 190
发布时间 : 3/12/2025
模型介绍
内容详情
替代品

模型简介

该模型是针对图形用户界面(GUI)优化的多模态模型,能够理解和生成与GUI相关的文本和图像内容。

模型特点

GUI优化
专门针对图形用户界面任务进行微调,在GUI相关任务上表现优异。
多模态能力
能够同时处理图像和文本信息,实现跨模态理解与生成。
性能提升
在Screenspot基准测试上相比基础模型有显著性能提升。

模型能力

GUI图像理解
跨模态文本生成
GUI元素识别
多模态推理

使用案例

GUI自动化
GUI元素描述生成
根据GUI截图生成界面元素的描述文本
在Screenspot v2基准上达到91.8的准确率
GUI操作指导
根据GUI图像生成操作步骤说明