BAGEL是一个开源的7B活跃参数多模态基础模型,支持多模态理解与生成任务
下载量 190
发布时间 : 5/21/2025
模型简介
基于混合专家Transformer架构的多模态模型,在视觉理解、文本生成和图像编辑等任务上表现优异
模型特点
多模态统一架构
同时支持视觉理解和生成任务,通过单一模型处理多种模态数据
高级编辑能力
支持自由形式视觉编辑、多视角合成和世界导航等复杂任务
量化优化
提供INT8量化版本,优化推理效率
涌现特性
随着训练数据增加,模型展现出阶段性的能力涌现
模型能力
多模态理解
文本到图像生成
图像编辑
多视角合成
世界导航
序列推理
使用案例
视觉理解
多模态问答
基于图像内容的问答系统
在MMBench基准测试中得分85.0
内容生成
文本到图像生成
根据文本描述生成高质量图像
在GenEval基准测试中综合得分0.88
图像编辑
智能编辑
基于自然语言指令的图像编辑
在GEdit-Bench-EN基准测试中得分7.36
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文