GQA高效推理
Llama 3.3 70b Instruct Awq
Llama 3.3是Meta开发的多语言大语言模型,拥有700亿参数,针对多语言对话用例优化,在多项基准测试中表现优异。
大型语言模型
Transformers
支持多种语言
L
casperhansen
47.12k
32
Llama 3.2 90B Vision Instruct
Llama 3.2-Vision是Meta开发的多模态大语言模型,支持图像和文本输入,文本输出,在视觉识别、图像推理、图像描述和图像问答任务上表现优异。
图像生成文本
Transformers
支持多种语言
L
meta-llama
15.44k
337
Llama 3.1 Minitron 4B Width Base
其他
Llama-3.1-Minitron-4B-Width-Base是一个基础文本到文本模型,通过对Llama-3.1-8B进行剪枝获得,适用于多种自然语言生成任务。
大型语言模型
Transformers
英语
L
nvidia
10.15k
190
Minitron 8B Base
其他
Minitron-8B-Base是通过剪裁Nemotron-4 15B获得的大型语言模型,采用蒸馏持续训练方法,相比从头训练节省了40倍的训练token和1.8倍的计算成本。
大型语言模型
Transformers
英语
M
nvidia
5,725
66
Llama 3.1 8B
Meta Llama 3.1 是一个多语言大语言模型系列,包含8B、70B和405B三种规模的预训练及指令调优生成模型,针对多语言对话场景优化。
大型语言模型
Transformers
支持多种语言
L
meta-llama
1.0M
1,583
Meta Llama 3 70B
Meta发布的Llama 3系列大语言模型,包含8B和70B两种规模的预训练及指令调优生成式文本模型,针对对话场景优化,在行业基准测试中表现优异。
大型语言模型
Transformers
英语
M
meta-llama
15.32k
857
Llama 2 70b Chat Hf
Meta开源的700亿参数对话优化大语言模型,在安全性和实用性上媲美主流闭源模型
大型语言模型
Transformers
英语
L
meta-llama
34.78k
2,187