L

Litellama 460M 1T

由 ahxt 开发
LiteLlama是Meta AI的LLaMa 2精简版,仅含4.6亿参数并使用1万亿token训练的开源语言模型
下载量 1,225
发布时间 : 1/7/2024
模型介绍
内容详情
替代品

模型简介

一个轻量级开源语言模型,复现LLaMa 2架构但显著缩小规模,适用于文本生成和理解任务

模型特点

轻量高效
仅4.6亿参数,比原版LLaMa 2显著缩小规模
大规模训练
使用约1万亿token进行训练,确保模型性能
开源可用
基于MIT许可证发布,可自由使用和修改

模型能力

文本生成
问答系统
语言理解

使用案例

教育
知识问答
回答各类常识性问题
能准确回答如'最大的鸟类是什么'等基础问题
研究
轻量级语言模型研究
作为小型语言模型的研究基准
在MMLU等基准测试中表现良好