视觉特征提取

# 视觉特征提取

Dinov2 Base ONNX

这是facebook/dinov2-base模型的ONNX格式版本，适用于计算机视觉任务。

Comp SigLIP So400M

CoMP-MM-1B是一个支持原生图像分辨率输入的视觉基础模型（VFM），基于SigLIP持续预训练而成。

多模态融合

Sam2 Hiera Large.fb R1024 2pt1

基于HieraDet图像编码器的SAM2模型，专注于高效图像特征提取

Sam2 Hiera Large.fb R1024

基于timm库的SAM2模型，仅包含HieraDet图像编码器部分，适用于图像特征提取任务。

Dinov2.giant.patch 14.reg 4

DINOv2是一个基于视觉变换器(ViT)的图像特征提取模型，通过引入寄存器机制提升了特征提取能力。

图像特征提取

NVIDIA开发的视觉特征提取模型，用于生成图像嵌入，支持下游任务如图像分类。

视觉特征提取

DINOv2是Facebook Research发布的视觉模型，通过自监督学习提取通用视觉特征，适用于多种下游任务。

Dpt Dinov2 Giant Kitti

使用DINOv2作为骨干网络的DPT框架，用于深度估计任务。

Dpt Dinov2 Large Kitti

该模型采用DINOv2作为骨干网络的DPT框架，专注于深度估计任务。

Autotrain Ex And Pt 3122688388

这是一个使用AutoTrain训练的多类别图像分类模型，能够识别多种物体类别。

CvT-13是一种结合卷积神经网络和视觉变换器的混合架构模型，在ImageNet-1k数据集上预训练完成，适用于图像分类任务。

基于imagenet-1k训练的RegNet图像分类模型，通过神经架构搜索设计的高效网络结构

基于DINO方法自监督训练的视觉Transformer模型，适用于图像特征提取

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

简体中文

© 2025AIbase 备案号：闽ICP备08105208号-24