B

Bitnet B1 58 3B

由 1bitLLM 开发
BitNet b1.58是一种1.58位量化的大语言模型,通过量化权重到{-1,0,1}三值实现高效推理。该模型复现了原论文结果,在RedPajama数据集上训练了1000亿token。
下载量 1,109
发布时间 : 3/29/2024
模型介绍
内容详情
替代品

模型简介

BitNet b1.58是一种高效的大语言模型,采用1.58位量化技术,权重仅使用{-1,0,1}三值表示,显著降低了计算和存储需求,同时保持了接近全精度模型的性能。

模型特点

1.58位量化
权重仅使用{-1,0,1}三值表示,大幅降低模型存储和计算需求
高效推理
量化设计使得模型在推理时具有更高的计算效率
性能接近FP16
尽管大幅量化,模型性能仍接近全精度(FP16)版本
两阶段训练
采用论文建议的两阶段学习率和权重衰减策略优化训练过程

模型能力

文本生成
语言理解
零样本任务处理

使用案例

高效推理场景
边缘设备部署
利用低比特量化特性在资源受限设备上部署大语言模型
降低计算和存储需求,保持合理性能
大规模服务
在高并发场景下提供高效的语言模型服务
减少服务器资源消耗
研究应用
模型量化研究
作为低比特量化大语言模型的基准参考
提供可复现的量化模型实现