Qwen3 0.6B ONNX
Qwen3-0.6B是一个轻量级大语言模型,已转换为ONNX格式以便在网页端使用。
大型语言模型
Transformers

Q
onnx-community
5,051
8
Timesformer Hr Finetuned K600
TimeSformer-HR 是一个基于视频的动作识别模型,专门针对高分辨率视频进行了优化,并在 Kinetics-600 数据集上进行了微调。
视频处理
Transformers

T
onnx-community
17
0
Timesformer Hr Finetuned K400
TimeSformer-HR 是一个基于视频的高分辨率时空Transformer模型,在Kinetics-400数据集上进行了微调,适用于视频动作识别任务。
视频处理
Transformers

T
onnx-community
17
0
Timesformer Base Finetuned Ssv2
TimeSformer是一种基于Transformer的视频理解模型,专门针对时序动作识别任务进行了优化。
视频处理
Transformers

T
onnx-community
17
0
Yolov9 C
Gpl-3.0
YOLOv9-C 是基于 YOLOv9 架构的目标检测模型,适用于实时检测图像中的多种物体。
目标检测
Transformers

Y
Xenova
82
6
Depth Anything Small Hf
基于ONNX格式的小型深度估计模型,适配Transformers.js框架,适用于网页端深度图预测
3D视觉
Transformers

D
Xenova
4,829
8
Chinese Clip Vit Large Patch14
中文CLIP模型,基于Vision Transformer架构,支持图像与文本的跨模态理解与生成。
文本生成图像
Transformers

C
Xenova
14
0
Clip Vit Large Patch14
OpenAI 开源的 CLIP 模型,基于 Vision Transformer (ViT) 架构,支持图像和文本的联合理解。
文本生成图像
Transformers

C
Xenova
17.41k
0
Deberta V3 Base Tasksource Nli
基于DeBERTa-v3架构的自然语言推理模型,适配Transformers.js的ONNX权重版本
大型语言模型
Transformers

D
Xenova
31
0
Sam Vit Large
基于视觉Transformer架构的大规模图像分割模型,能够根据输入点生成高质量对象掩模
图像分割
Transformers

其他
S
Xenova
34
0
Whisper Tiny
Whisper Tiny 是 OpenAI 开源的轻量级语音识别模型,适用于网页端部署。
语音识别
Transformers

W
Xenova
21.70k
8
Detr Resnet 50
基于Transformer架构的端到端目标检测模型,无需传统目标检测中的锚框设计
目标检测
Transformers

D
Xenova
5,261
16
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文