超长上下文理解
Llama 4 Maverick 17B 128E Instruct
其他
Llama 4 Maverick是Meta推出的170亿参数混合专家架构(MoE)多模态模型,支持12种语言和图像理解,适用于商业与研究用途。
多模态融合
Transformers
支持多种语言
L
RedHatAI
29
1
Llama 4 Scout 17B 16E Instruct Bnb 8bit
其他
Llama 4系列是Meta开发的多模态AI模型,支持文本与图像交互,采用混合专家架构(MoE),在文本和图像理解领域具有领先性能。
多模态融合
Transformers
支持多种语言
L
bnb-community
132
1
Llama 4 Scout 17B 16E Unsloth
其他
Llama 4 Scout是Meta推出的170亿参数多模态AI模型,采用混合专家架构,支持12种语言和图像理解。
文本生成图像
Transformers
支持多种语言
L
unsloth
67
1
Meta Llama Llama 4 Maverick 17B 128E Instruct
其他
Llama 4 Maverick 是 Meta 发布的多模态 AI 模型,支持文本与图像理解,采用混合专家架构(MoE),在多语言文本和代码生成任务中表现优异。
多模态融合
Transformers
支持多种语言
M
Undi95
35
2
Llama 3.1 8B UltraLong 4M Instruct
专为处理超长文本序列(最高支持100万、200万和400万标记)设计的大语言模型,在标准基准测试中保持卓越性能
大型语言模型
Transformers
英语
L
nvidia
264
27
Llama 3.1 Nemotron 8B UltraLong 4M Instruct
Nemotron-UltraLong-8B是专为处理超长文本序列设计的语言模型,支持最高400万标记的上下文窗口,同时在标准基准测试中保持卓越性能。
大型语言模型
Transformers
英语
L
nvidia
4,363
103
Llama 3.1 8B UltraLong 1M Instruct
Nemotron-UltraLong-8B系列是专为处理超长文本序列设计的语言模型,支持最高400万token的上下文窗口,同时保持卓越性能。
大型语言模型
Transformers
英语
L
nvidia
1,387
26
Llama 3.1 Nemotron 8B UltraLong 1M Instruct
专为处理超长文本序列(最高支持100万、200万和400万标记)设计的大语言模型,在标准基准测试中保持卓越性能。
大型语言模型
Transformers
英语
L
nvidia
4,025
40