L

Layerskip Llama2 7B

由 facebook 开发
基于Llama2 7B改进的模型,支持层级跳跃和自推测解码,提升推理效率
下载量 1,674
发布时间 : 6/13/2024
模型介绍
内容详情
替代品

模型简介

通过持续预训练支持层级跳跃功能,能够先用浅层生成草稿再用深层验证,实现自推测解码以加速推理过程

模型特点

层级跳跃
支持早期退出推理,允许模型在不同深度层级进行预测
自推测解码
先用浅层子模型生成草稿,再用深层模型验证,显著提升解码速度
高效推理
相比标准Llama2模型,自推测解码可带来60%的速度提升

模型能力

文本生成
问答系统
内容创作

使用案例

研究开发
高效推理研究
用于研究大语言模型的高效推理方法
自推测解码速度提升60%
教育应用
教学演示
展示大语言模型的工作原理和优化技术