实时场景理解
Distill Any Depth Small Hf
Apache-2.0
Distill-Any-Depth 是一个用于深度估计的模型,基于 transformers 架构,适用于从图像中估计深度信息。
3D视觉
Transformers
D
keetrap
99
1
Mini Image Captioning
Apache-2.0
一个基于bert-mini和vit-small的轻量级图像字幕生成模型,仅重130MB,在CPU上运行速度极快。
图像生成文本
Transformers
英语
M
cnmoro
292
3
Deeplabv3plus Tu Resnet18
MIT
基于PyTorch的语义分割模型,支持多种编码器架构
图像分割
Safetensors
D
smp-test-models
213
0
Coreml Depth Anything V2 Small
Apache-2.0
Depth Anything V2 是基于 DPT 架构的深度估计模型,采用 DINOv2 骨干网络,通过大规模合成和真实数据训练,实现精细且鲁棒的深度预测。
3D视觉
C
apple
67
58
Depth Anything V2 Small
Apache-2.0
Depth Anything V2 Small 的 ONNX 版本,专为 Transformers.js 设计,用于单目深度估计任务。
3D视觉
Transformers
D
onnx-community
897
14
Depth Anything Large Hf
基于Transformers.js的深度估计模型ONNX版本,适用于网页端应用
3D视觉
Transformers
D
Xenova
19
3
Depth Anything Base Hf
基于Transformers.js的深度估计模型,适配ONNX权重版本,用于从图像中预测深度信息。
3D视觉
Transformers
D
Xenova
53
0
Depth Anything Small Hf
基于ONNX格式的小型深度估计模型,适配Transformers.js框架,适用于网页端深度图预测
3D视觉
Transformers
D
Xenova
4,829
8
Sentis MiDaS
MIT
将 MiDaS 模型转换为 ONNX 格式,用于在 Unity Sentis 中进行单目深度估计
3D视觉
S
julienkay
31
5