llama2_xs_460M_experimental开源模型 - 小参数大语言模型免费部署

首页

Llama2 Xs 460M Experimental

由 ahxt 开发

本系列仓库开源复现了Meta AI的LLaMA和LLaMA 2大语言模型，但模型规模显著缩小，其中llama1_s实验版含18亿参数，llama2_xs实验版仅含4.6亿参数。

大型语言模型

Transformers

英语#小规模LLaMA复现 #RedPajama训练 #GPT2分词器

下载量 145

发布时间 : 7/26/2023

模型简介

LLaMa精简版是LLaMA和LLaMA 2的缩小规模实验版本，旨在提供更轻量级的大语言模型选择，适用于研究用途。

模型特点

轻量级架构

显著缩小了原始LLaMA模型的规模，提供更高效的推理能力

开源复现

完全复现了Meta AI的LLaMA和LLaMA 2架构

研究友好

专门为研究目的设计，便于学术实验和模型分析

模型能力

英文文本生成

问答任务处理

知识推理

使用案例

学术研究

语言模型压缩研究

研究大规模语言模型的压缩和效率优化

实现了4.6亿参数的轻量级模型

教育应用

问答系统

构建轻量级问答系统

在MMLU任务上达到26.39的五样本准确率

🚀 LLaMa Lite：LLaMA和LLaMa 2的缩减规模实验版本

本系列仓库开源复现了Meta AI的LLaMA和LLaMa 2大语言模型。不过，模型规模大幅缩减，llama1_s实验版本有18亿参数，llama2_xs实验版本有4.6亿参数（'s'代表小，'xs'代表极小）。

✨ 主要特性

提供LLaMA和LLaMa 2的缩减规模实验版本。
可直接使用HuggingFace Transformers库加载实验模型。

📦 安装指南

文档未提及安装步骤，可参考HuggingFace Transformers库的安装方法来使用本实验模型。

💻 使用示例

基础用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# model_path = 'ahxt/llama2_xs_460M_experimental'
model_path = 'ahxt/llama1_s_1.8B_experimental'

model = AutoModelForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path)
model.eval()

prompt = 'Q: What is the largest bird?\nA:'
input_ids = tokenizer(prompt, return_tensors="pt").input_ids
tokens = model.generate(input_ids, max_length=20)
print( tokenizer.decode(tokens[0].tolist(), skip_special_tokens=True) )
# Q: What is the largest bird?\nA: The largest bird is the bald eagle.

📚 详细文档

数据集与分词

我们在部分RedPajama数据集上训练模型，使用GPT2Tokenizer对文本进行分词。

使用HuggingFace Transformers库

实验模型的检查点可直接通过Transformers库加载。上述代码片段展示了如何加载实验模型并生成文本。

评估

我们在MMLU任务上对模型进行评估，结果如下：

模型	参数数量	零样本	5样本
llama	70亿	28.46	35.05
openllama	30亿	24.90	26.71
TinyLlama - 1.1B - step - 50K - 105b	11亿	19.00	26.53
llama2_xs_460M	4600万	21.13	26.39

Open LLM Leaderboard评估结果

详细结果可查看此处

指标	值
平均值	26.65
ARC (25样本)	24.91
HellaSwag (10样本)	38.47
MMLU (5样本)	26.17
TruthfulQA (0样本)	41.59
Winogrande (5样本)	49.88
GSM8K (5样本)	0.0
DROP (3样本)	5.51