L

LLAMA 3 Quantized

由 Kameshr 开发
Meta Llama 3 - 8B Instruct大语言模型的8位量化版本,减小模型体积并提升推理速度,适合资源有限设备部署。
下载量 18
发布时间 : 5/3/2024
模型介绍
内容详情
替代品

模型简介

基于自回归Transformer架构的大语言模型,通过海量文本和代码训练,并针对指令跟随任务进行微调,在对话任务中表现优异。

模型特点

8位量化技术
通过量化减小模型体积并提升推理速度,适合资源有限设备部署
指令微调优化
针对对话场景进行优化,在指令跟随任务中表现优异
分组查询注意力(GQA)
提升推理扩展性,优化计算效率

模型能力

文本生成
代码生成
指令跟随对话
知识问答
阅读理解

使用案例

对话助手
客服机器人
用于企业客服场景的智能对话系统
在行业基准测试中超越多数开源聊天模型
教育应用
学习助手
帮助学生解答问题和提供学习资源
在MMLU(5样本)测试中获得66.6分