大规模视觉编码

# 大规模视觉编码

Siglip2 Giant Opt Patch16 256

SigLIP 2 是一个先进的视觉语言模型，整合了多项技术以提升语义理解、定位和密集特征提取能力。

文本生成图像

Aimv2 3b Patch14 224.apple Pt

AIM-v2是一个高效的图像编码器模型，兼容timm框架，适用于计算机视觉任务。

Aimv2 Large Patch14 224 Distilled

AIMv2是通过多模态自回归目标预训练的视觉模型系列，在多模态理解基准测试中表现优异。

Aimv2 3B Patch14 448

AIMv2是通过多模态自回归目标预训练的视觉模型系列，在多个视觉理解基准测试中表现优异。

Aimv2 1B Patch14 448

AIMv2 是通过多模态自回归目标预训练的视觉模型系列，在多个视觉理解基准测试中表现优异。

Aimv2 Huge Patch14 448

AIMv2是通过多模态自回归目标预训练的视觉模型系列，在多个基准测试中表现优异。

Aimv2 Large Patch14 448

AIMv2是基于多模态自回归目标预训练的视觉模型系列，在多个基准测试中表现优异

Aimv2 3B Patch14 336

AIMv2 是一个通过多模态自回归目标预训练的视觉模型系列，在多个多模态理解基准测试中表现优异。

Aimv2 Large Patch14 336

AIMv2是基于多模态自回归目标预训练的视觉模型系列，在多项视觉任务中表现优异。

Aimv2 1B Patch14 224

AIMv2 是通过多模态自回归目标预训练的视觉模型系列，在多项视觉任务中表现优异。

Aimv2 Huge Patch14 224

AIMv2 是通过多模态自回归目标预训练的视觉模型系列，在多项基准测试中表现优异。

Aimv2 Large Patch14 224

AIMv2是通过多模态自回归目标预训练的视觉模型系列，在多项视觉任务中表现优异。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24