Hiera Huge 224 Hf
Hiera是一种高效的分层视觉Transformer模型,在图像和视频任务中表现优异且运行速度快
图像分类
Transformers

英语
H
facebook
41
1
Upernet Swin Large
MIT
UperNet是一种用于语义分割的框架,结合Swin Transformer骨干网络实现像素级场景理解
图像分割
Transformers

英语
U
openmmlab
3,251
0
Dinat Mini In1k 224
MIT
DiNAT-Mini是基于邻域注意力机制的分层视觉Transformer模型,专为图像分类任务设计。
图像分类
Transformers

D
shi-labs
462
1
Swinv2 Large Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2是基于ImageNet-21k预训练并在384x384分辨率下对ImageNet-1k进行微调的视觉Transformer模型,具有分层特征图和局部窗口自注意力机制。
图像分类
Transformers

S
microsoft
3,048
4
Swinv2 Large Patch4 Window12to16 192to256 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers

S
microsoft
812
4
Swinv2 Base Patch4 Window12to24 192to384 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers

S
microsoft
1,824
0
Swinv2 Base Patch4 Window12to16 192to256 22kto1k Ft
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类。
图像分类
Transformers

S
microsoft
459
1
Swinv2 Base Patch4 Window12 192 22k
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像处理。
图像分类
Transformers

S
microsoft
8,603
3
Swinv2 Base Patch4 Window16 256
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers

S
microsoft
1,853
3
Swinv2 Base Patch4 Window8 256
Apache-2.0
Swin Transformer v2是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类和密集识别任务。
图像分类
Transformers

S
microsoft
16.61k
7
Swinv2 Small Patch4 Window16 256
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像处理。
图像分类
Transformers

S
microsoft
315
1
Swinv2 Tiny Patch4 Window16 256
Apache-2.0
Swin Transformer v2 是一种视觉Transformer模型,通过分层特征图和局部窗口自注意力机制实现高效的图像分类。
图像分类
Transformers

S
microsoft
403.69k
5
Swinv2 Tiny Patch4 Window8 256
Apache-2.0
Swin Transformer v2是基于ImageNet-1k预训练的视觉Transformer模型,采用分层特征图和局部窗口自注意力机制,具有线性计算复杂度。
图像分类
Transformers

S
microsoft
25.04k
10
Swin Base Patch4 Window7 224
Apache-2.0
Swin Transformer是一种基于移动窗口的分层视觉Transformer,适用于图像分类任务。
图像分类
Transformers

S
microsoft
281.49k
15
Swin Large Patch4 Window7 224
Apache-2.0
Swin Transformer是一种层次化视觉Transformer,通过局部窗口计算自注意力实现线性计算复杂度,适合图像分类和密集识别任务。
图像分类
Transformers

S
microsoft
2,079
1
Swin Large Patch4 Window12 384
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer模型,专为图像分类任务设计。
图像分类
Transformers

S
microsoft
22.77k
1
Swin Base Patch4 Window12 384
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer,专为图像分类任务设计,计算复杂度与输入图像大小呈线性关系。
图像分类
Transformers

S
microsoft
1,421
4
Swin Small Patch4 Window7 224
Apache-2.0
Swin Transformer是一种基于分层窗口的视觉Transformer模型,专为图像分类任务设计,计算复杂度与输入图像大小呈线性关系。
图像分类
Transformers

S
microsoft
2,028
1
Swin Base Patch4 Window7 224 In22k
Apache-2.0
Swin Transformer是一种基于分层窗口计算的视觉Transformer模型,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers

S
microsoft
13.30k
15
Swin Large Patch4 Window12 384 In22k
Apache-2.0
Swin Transformer是一种基于分层窗口的视觉Transformer模型,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers

S
microsoft
1,063
7
Swin Tiny Patch4 Window7 224
Apache-2.0
Swin Transformer是一种分层视觉Transformer,通过局部窗口计算自注意力实现线性计算复杂度,适合图像分类任务。
图像分类
Transformers

S
microsoft
98.00k
42
Swin Large Patch4 Window7 224 In22k
Apache-2.0
Swin Transformer是一种基于移动窗口的分层视觉Transformer,在ImageNet-21k数据集上预训练,适用于图像分类任务。
图像分类
Transformers

S
microsoft
387
2
Swin Base Patch4 Window12 384 In22k
Apache-2.0
Swin Transformer是一种基于移位窗口的分层视觉Transformer模型,专为图像分类任务设计。
图像分类
Transformers

S
microsoft
2,431
1
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文