网页端部署
Qwen3 0.6B ONNX
Qwen3-0.6B是一个轻量级大语言模型,已转换为ONNX格式以便在网页端使用。
大型语言模型
Transformers
Q
onnx-community
5,051
8
Timesformer Hr Finetuned K600
TimeSformer-HR 是一个基于视频的动作识别模型,专门针对高分辨率视频进行了优化,并在 Kinetics-600 数据集上进行了微调。
视频处理
Transformers
T
onnx-community
17
0
Timesformer Hr Finetuned K400
TimeSformer-HR 是一个基于视频的高分辨率时空Transformer模型,在Kinetics-400数据集上进行了微调,适用于视频动作识别任务。
视频处理
Transformers
T
onnx-community
17
0
Timesformer Base Finetuned Ssv2
TimeSformer是一种基于Transformer的视频理解模型,专门针对时序动作识别任务进行了优化。
视频处理
Transformers
T
onnx-community
17
0
Yolov9 C
Gpl-3.0
YOLOv9-C 是基于 YOLOv9 架构的目标检测模型,适用于实时检测图像中的多种物体。
目标检测
Transformers
Y
Xenova
82
6
Depth Anything Small Hf
基于ONNX格式的小型深度估计模型,适配Transformers.js框架,适用于网页端深度图预测
3D视觉
Transformers
D
Xenova
4,829
8
Chinese Clip Vit Large Patch14
中文CLIP模型,基于Vision Transformer架构,支持图像与文本的跨模态理解与生成。
文本生成图像
Transformers
C
Xenova
14
0
Clip Vit Large Patch14
OpenAI 开源的 CLIP 模型,基于 Vision Transformer (ViT) 架构,支持图像和文本的联合理解。
文本生成图像
Transformers
C
Xenova
17.41k
0
Deberta V3 Base Tasksource Nli
基于DeBERTa-v3架构的自然语言推理模型,适配Transformers.js的ONNX权重版本
大型语言模型
Transformers
D
Xenova
31
0
Sam Vit Large
基于视觉Transformer架构的大规模图像分割模型,能够根据输入点生成高质量对象掩模
图像分割
Transformers
其他
S
Xenova
34
0
Whisper Tiny
Whisper Tiny 是 OpenAI 开源的轻量级语音识别模型,适用于网页端部署。
语音识别
Transformers
W
Xenova
21.70k
8
Detr Resnet 50
基于Transformer架构的端到端目标检测模型,无需传统目标检测中的锚框设计
目标检测
Transformers
D
Xenova
5,261
16