L

Llama2 Xs 460M Experimental

由 ahxt 开发
本系列仓库开源复现了Meta AI的LLaMA和LLaMA 2大语言模型,但模型规模显著缩小,其中llama1_s实验版含18亿参数,llama2_xs实验版仅含4.6亿参数。
下载量 145
发布时间 : 7/26/2023
模型介绍
内容详情
替代品

模型简介

LLaMa精简版是LLaMA和LLaMA 2的缩小规模实验版本,旨在提供更轻量级的大语言模型选择,适用于研究用途。

模型特点

轻量级架构
显著缩小了原始LLaMA模型的规模,提供更高效的推理能力
开源复现
完全复现了Meta AI的LLaMA和LLaMA 2架构
研究友好
专门为研究目的设计,便于学术实验和模型分析

模型能力

英文文本生成
问答任务处理
知识推理

使用案例

学术研究
语言模型压缩研究
研究大规模语言模型的压缩和效率优化
实现了4.6亿参数的轻量级模型
教育应用
问答系统
构建轻量级问答系统
在MMLU任务上达到26.39的五样本准确率