L

Llama3 8B 1.58 100B Tokens

由 HF1BitLLM 开发
基于BitNet 1.58b架构微调的大型语言模型,基础模型为Llama-3-8B-Instruct,采用极端量化技术
下载量 2,427
发布时间 : 9/10/2024
模型介绍
内容详情
替代品

模型简介

Llama3-8B-1.58是一个采用1.58比特量化的高效大型语言模型,通过1000亿token训练优化,在保持性能的同时显著降低计算资源需求

模型特点

极端量化技术
采用1.58比特量化架构,显著降低模型存储和计算需求
大规模训练
经过1000亿token的扩展训练,性能接近半精度模型
高效推理
在保持良好性能的同时减少资源消耗

模型能力

文本生成
问答系统
逻辑推理

使用案例

教育
推理问答
解决多步推理问题,如跟踪人物位置变化
能够正确回答涉及多步位置变化的推理问题
研究
量化技术研究
探索极端量化条件下LLM的性能边界
性能接近半精度模型