J

Jedi 3B 1080p

由 xlangai 开发

基于Qwen2.5-VL-3B的多模态指令模型，专注于计算机使用场景的视觉语言任务

图像生成文本

英语

开源协议:Apache-2.0 #多模态指令理解 #计算机界面交互 #3B参数高效

下载量 632

发布时间 : 4/28/2025

模型介绍

内容详情

替代品

模型简介

这是一个3B参数的视觉语言模型，专门针对计算机界面理解和操作任务进行了优化，能够处理图像和文本输入，生成相应的文本输出。

模型特点

多模态理解

能够同时处理图像和文本输入，理解计算机界面内容

指令跟随

专门针对指令跟随场景优化，适合构建交互式代理

计算机界面专注

特别针对计算机使用场景进行了训练和优化

模型能力

图像理解

文本生成

界面元素识别

指令解释与执行

使用案例

计算机辅助操作

界面自动化

根据用户指令自动操作计算机界面

提高人机交互效率

任务指导

通过视觉和语言指导用户完成计算机操作任务

降低用户学习成本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

AIbase

AIbase是一个专注于MCP服务的平台，为AI开发者提供高质量的模型上下文协议服务，助力AI应用开发。

简体中文

热门模型

Llama 3 Typhoon V1.5x 8b Instruct

Roberta Base Chinese Extractive Qa

热门模型分类

大型语言模型

热门标签

多语言支持

低资源优化

低词错误率

基于Transformer

SentencePiece预处理

© 2025AIbase 备案号：闽ICP备08105208号-24