L

Llama 13b Hf

由 sharpbai 开发
LLaMA-13B是Meta AI开发的基础语言模型,拥有130亿参数,基于Transformer架构,适用于大语言模型研究。
下载量 53
发布时间 : 6/20/2023
模型介绍
内容详情
替代品

模型简介

LLaMA-13B是一种高效的自回归语言模型,主要用于自然语言处理研究,包括问答、自然语言理解和阅读理解等任务。

模型特点

高效训练
使用优化的Transformer架构和高效的训练方法,在相对较少的计算资源下实现高性能。
多语言支持
支持包括英语、西班牙语、法语等多种语言,尽管英语性能最优。
研究导向
专为语言模型研究设计,适合探索模型能力、局限性和改进技术。

模型能力

文本生成
问答系统
自然语言理解
阅读理解
常识推理

使用案例

学术研究
语言模型能力评估
用于评估模型在不同语言任务上的表现,如常识推理和阅读理解。
在BoolQ、PIQA等基准测试中表现优异。
偏见研究
研究模型输出中的偏见问题,如性别、宗教等领域的偏见。
在WinoGender和CrowS-Pairs等数据集上进行了评估。
技术开发
模型改进技术
作为基础模型,用于开发和测试新的模型改进技术。