I

Internvl3 38B

由 FriendliAI 开发
InternVL3-38B 是一款先进的多模态大语言模型,在多模态感知、推理等能力上表现卓越,相较于前代模型有显著提升,还拓展了工具使用、GUI 代理等多模态能力。
下载量 166
发布时间 : 4/12/2025

模型简介

InternVL3-38B 是一款多模态大语言模型,具备强大的多模态感知和推理能力,支持工具使用、GUI 代理等多种应用场景。

模型特点

先进的多模态能力
相比 InternVL 2.5,InternVL3 展现出更出色的多模态感知和推理能力,还将多模态能力拓展到工具使用、GUI 代理、工业图像分析、3D 视觉感知等领域。
优秀的语言性能
与 Qwen2.5 Chat 模型相比,得益于原生多模态预训练,InternVL3 系列在整体文本性能上表现更优。
灵活的模型架构
采用“ViT - MLP - LLM”范式,集成新的增量预训练 InternViT 和多种预训练大语言模型,如 InternLM 3 和 Qwen 2.5。
高效的训练策略
提出原生多模态预训练方法,将语言和视觉学习整合到一个预训练阶段;在监督微调阶段使用高质量、多样化的训练数据;采用混合偏好优化(MPO)方法提升推理性能。

模型能力

多模态感知
多模态推理
工具使用
GUI 代理
工业图像分析
3D 视觉感知
文本生成
图像分析

使用案例

多模态推理
多模态推理任务
在多个多模态推理基准测试中表现出色。
InternVL3-38B 比其对应模型高出 4.5 分。
GUI 操作
GUI 代理
支持 GUI 操作任务。
工业图像分析
工业图像分析
支持工业图像分析任务。
AIbase
智启未来,您的人工智能解决方案智库
简体中文