低计算开销
Lsnet B
MIT
LSNet是一个受人类视觉系统动态异尺度能力启发的轻量级视觉模型家族,在多种视觉任务中实现了性能与效率的平衡。
图像分类
L
jameslahm
186
1
Rfdetr Large ONNX
Apache-2.0
RF-DETR Large 是一个基于 DETR 架构的目标检测模型,专为高效检测图像中的物体而设计。
目标检测
Transformers
R
onnx-community
23
2
Swarmformer Small Ef
Apache-2.0
SwarmFormer是一种高效序列建模架构,通过分层注意力机制和动态聚类技术优化长序列处理能力。
大型语言模型
Transformers
S
Mayank6255
15
2
Opensearch Neural Sparse Encoding Doc V2 Mini
Apache-2.0
OpenSearch的学习型稀疏检索模型v2迷你版,将文档编码为稀疏向量,优化搜索相关性和效率
文本嵌入
Transformers
英语
O
opensearch-project
113
2
Chattruth 7B
ChatTruth-7B是基于Qwen-VL架构优化的多语言视觉-语言模型,增强了大分辨率图像处理能力并引入还原模块降低计算开销
图像生成文本
Transformers
支持多种语言
C
mingdali
73
13
Ced Small
Apache-2.0
CED是基于ViT-Transformer的简易音频标注模型,在Audioset上实现了最先进的性能表现。
音频分类
Transformers
C
mispeech
18
0
Mobilevitv2 1.0 Imagenet1k 256
其他
MobileViTv2是MobileViT的第二代版本,通过可分离自注意力机制改进,适用于图像分类任务。
图像分类
Transformers
M
apple
9,966
7
Levit 128
Apache-2.0
LeViT-128是一个基于视觉Transformer架构的图像分类模型,通过结合卷积网络的优势实现高效推理。
图像分类
Transformers
L
facebook
44
0
Levit 192
Apache-2.0
LeViT-192是一种结合了卷积神经网络和Transformer架构的视觉模型,专注于图像分类任务。
图像分类
Transformers
L
facebook
23
0
Hifigan Lj V1
基于LJ Speech数据集训练的HiFi-GAN声码器模型,用于高质量语音合成
语音合成
Transformers
英语
H
jaketae
32
0
Fnet Base Finetuned Sst2
Apache-2.0
基于谷歌FNet架构在SST-2情感分析数据集上微调的文本分类模型
文本分类
英语
F
gchhablani
16
1