网页端适配
Qwen3 1.7B ONNX
Qwen3-1.7B 是阿里云推出的1.7B参数规模的开源大语言模型,基于Transformer架构,支持多种自然语言处理任务。
大型语言模型
Transformers
Q
onnx-community
189
1
Flarenew
MIT
LaMini-Flan-T5-783M 是一个基于T5架构的轻量级文本生成模型,支持英语、俄语和乌克兰语,适用于多种自然语言处理任务。
大型语言模型
Transformers
支持多种语言
F
HaveAI
718
1
Nsfw Image Detection
用于检测图像是否包含不适宜工作场所(NSFW)内容的模型,支持网页端部署
图像分类
Transformers
N
jdp8
96
2
Whisper Large V3 Turbo
基于ONNX格式优化的Whisper大型语音识别模型,专为网页端部署设计
语音识别
Transformers
W
onnx-community
2,988
54
Hiera Small 224 Hf
Hiera是一种高效的视觉Transformer模型,专为图像分类任务设计,具有较小的参数量和高效的计算性能。
图像分类
Transformers
H
onnx-community
16
1
Timesformer Base Finetuned K600
TimeSformer 是一个基于 Transformer 架构的视频理解模型,专门用于处理视频分类任务。
视频处理
Transformers
T
onnx-community
16
0
Whisper Base.en
Whisper是一个通用的语音识别模型,由OpenAI训练。
语音识别
Transformers
W
onnx-community
76
1
Whisper Base
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多语言语音转录。
语音识别
Transformers
W
onnx-community
5,704
19
Musicgen Small
MusicGen Small 是一个基于 Transformer 架构的音乐生成模型,能够根据文本描述生成高质量的音乐片段。
音频生成
Transformers
M
Xenova
5,434
24
Yolov9 C All
Gpl-3.0
基于 YOLOv9 的目标检测模型,适配 Transformers.js,支持在浏览器中运行
目标检测
Transformers
Y
Xenova
176
2
Gelan C All
Gpl-3.0
基于 YOLOv9 (GELAN-C) 架构的目标检测模型,专为 Transformers.js 优化的 ONNX 版本
目标检测
Transformers
G
Xenova
789
4
Depth Anything Large Hf
基于Transformers.js的深度估计模型ONNX版本,适用于网页端应用
3D视觉
Transformers
D
Xenova
19
3
Hubert Base Superb Ks
基于HuBERT架构的语音指令识别模型,专为关键词识别任务优化
音频分类
Transformers
H
Xenova
17
1
Dinov2 Large
DINOv2是Facebook Research发布的视觉模型,通过自监督学习提取通用视觉特征,适用于多种下游任务。
图像嵌入
Transformers
D
Xenova
82
1
Owlvit Base Patch32
OWL-ViT是一个基于视觉Transformer的零样本目标检测模型,能够在不进行微调的情况下检测新类别的物体。
目标检测
Transformers
O
Xenova
86
1
Dpt Hybrid Midas
Intel开发的混合深度估计模型,结合了卷积神经网络和Transformer架构的优势
3D视觉
Transformers
D
Xenova
23
0
Nougat Base
Nougat是一个基于视觉的学术文档理解模型,能够将科学PDF图像转换为Markdown格式文本。
图像生成文本
Transformers
N
Xenova
24
3
Trocr Base Printed
TrOCR是基于Transformer的OCR模型,专门用于识别印刷体文本。
文字识别
Transformers
T
Xenova
40
0
Trocr Small Printed
TrOCR-small-printed 是一个小型的光学字符识别(OCR)模型,专门用于识别印刷体文本。
文字识别
Transformers
T
Xenova
79
3
Distilbart Cnn 12 6
DistilBART-CNN-12-6是BART模型的蒸馏版本,专为文本摘要任务优化,体积更小但保持较高性能。
文本生成
Transformers
D
Xenova
218
0
Yolos Base
YOLOS是基于Transformer架构的目标检测模型,专为高效处理视觉任务而设计。
目标检测
Transformers
Y
Xenova
16
0
Yolos Small
YOLOS-small 是一个基于 Transformer 架构的小型目标检测模型,专为高效视觉任务设计。
目标检测
Transformers
Y
Xenova
63
0
Deberta V3 Large Tasksource Nli
基于DeBERTa-v3-large架构的自然语言推理模型,适配Transformers.js的ONNX权重版
文本分类
Transformers
D
Xenova
31
1
Nli Deberta Base
基于DeBERTa架构的自然语言推理(NLI)模型,适用于零样本分类任务,已转换为ONNX格式以兼容Transformers.js
文本分类
Transformers
N
Xenova
30
0
Deberta V3 Base Mnli Fever Anli
基于DeBERTa-v3的零样本分类模型,支持多任务自然语言推理(MNLI)、FEVER和ANLI任务,已转换为ONNX格式以适配Transformers.js
大型语言模型
Transformers
D
Xenova
52
0
Nli Deberta V3 Small
基于DeBERTa-v3的小型自然语言推理模型,适用于零样本分类任务
文本分类
Transformers
N
Xenova
423
0
E5 Small V2
E5-small-v2 是一个高效的文本嵌入模型,适用于多种自然语言处理任务。
文本嵌入
Transformers
E
Supabase
35
2
Wav2vec2 Base Superb Ks
基于wav2vec2架构的音频分类模型,适用于关键词检测任务
音频分类
Transformers
W
Xenova
21
1
Wav2vec2 Base 960h
基于Facebook wav2vec2-base-960h模型的ONNX格式转换版本,专为Transformers.js设计,支持浏览器端语音识别
语音识别
Transformers
W
Xenova
117
3
Mms Lid 4017
MMS-LID-4017 是一个支持4017种语言的语音识别模型,由Facebook开发,专注于语言识别任务。
文本分类
Transformers
M
Xenova
15
1
Mms Lid 126
MMS-LID-126 是 Facebook 发布的多语言语音识别模型,支持 126 种语言的识别。
文本分类
Transformers
M
Xenova
14
0
Ast Finetuned Speech Commands V2
基于AST架构的语音命令识别模型,专为网页端部署优化的ONNX格式版本
音频分类
Transformers
A
Xenova
15
0
Ast Finetuned Audioset 10 10 0.4593
基于AudioSet数据集微调的音频谱图变换器(AST)模型,用于音频分类任务
音频分类
Transformers
A
Xenova
82
0
Whisper Medium
Whisper Medium 是 OpenAI 开发的中等规模语音识别模型,支持多种语言的自动语音识别(ASR)任务。
语音识别
Transformers
W
Xenova
871
4
Detr Resnet 101
基于Transformer架构的端到端目标检测模型,结合ResNet-101特征提取器
目标检测
Transformers
D
Xenova
216
2
Whisper Small
Whisper Small 是 OpenAI 开发的一个小型自动语音识别(ASR)模型,能够将语音转换为文本。
语音识别
Transformers
W
Xenova
1,716
9
Whisper Base
Whisper是一个自动语音识别(ASR)系统,由OpenAI训练,支持多种语言的语音转文本任务。
语音识别
Transformers
W
Xenova
6,204
7
Bart Large Cnn
基于BART架构的大型文本摘要模型,专为CNN/DailyMail数据集优化
文本生成
Transformers
B
Xenova
173
8
Whisper Tiny.en
OpenAI Whisper-tiny.en 模型的 ONNX 权重版本,专为 Transformers.js 设计,用于英语语音转录。
语音识别
Transformers
W
Xenova
33.10k
11