L

Llama2 22b

由 chargoddard 开发
基于Llama 2 13B的改进版本,融合了原始Llama 33B的部分注意力头机制,通过RedPajama数据集微调增强稳定性
下载量 90
发布时间 : 7/22/2023
模型介绍
内容详情
替代品

模型简介

这是一个增强版的大语言模型,结合了Llama 2 13B和原始Llama 33B的优势,旨在作为进一步调优的基础平台

模型特点

混合架构
结合了Llama 2 13B和原始Llama 33B的注意力机制
稳定微调
通过RedPajama约1000万token的微调使移植结构更稳定
扩展基础
设计为调优基础平台,预期比13B版本有更强学习能力

模型能力

文本生成
语言理解
知识问答

使用案例

研究开发
模型调优基础
作为进一步调优的基础模型使用
预期获得比13B版本更强的学习能力
自然语言处理
文本生成
生成连贯的文本内容