Dbrx Base

由 databricks 开发

Databricks开发的混合专家(MoE)大语言模型，1320亿参数总量，360亿激活参数，支持32K上下文窗口

大型语言模型

Transformers

开源协议:其他 #混合专家架构 #1320亿参数 #英语文本补全

下载量 100

发布时间 : 3/26/2024

模型介绍

内容详情

替代品

模型简介

DBRX是基于Transformer架构的仅解码器大语言模型，采用细粒度混合专家架构，适用于文本补全和代码生成任务

模型特点

细粒度混合专家架构

采用16选4专家结构，专家组合可能性比传统8选2架构提升65倍

大规模预训练

在12万亿精选token上训练，数据质量较前代提升2倍

高效推理

通过GQA分组查询注意力机制和FlashAttention2优化计算效率

企业级部署支持

可通过Databricks基础模型API进行生产环境部署

模型能力

英语文本补全

代码生成与补全

长上下文处理（32K tokens）

商业场景二次微调

使用案例

通用文本处理

文档自动续写

根据开头段落生成连贯的后续内容

软件开发

代码自动补全

根据函数签名或注释生成实现代码

HumanEval基准测试表现优异

企业应用

领域知识问答系统

基于RAG架构构建专业领域问答助手

extra_gated_heading: 访问此模型需向Databricks提供联系信息 extra_gated_prompt: >-

DBRX使用条款

DBRX的使用受Databricks开放模型许可证和Databricks开放模型可接受使用政策约束。

extra_gated_fields: 名字: 文本姓氏: 文本组织机构: 文本获取基础模型的用途: 文本点击下方"提交"即表示我接受许可条款，并同意所提供信息将根据Databricks隐私声明进行收集、存储、处理和共享，且我理解可随时更新偏好设置: 复选框 extra_gated_description: >- 您提供的信息将根据Databricks隐私声明进行收集、存储、处理和共享。 extra_gated_button_content: 提交 inference: false license: other license_name: databricks-open-model-license license_link: https://www.databricks.com/legal/open-model-license tags:

混合专家模型

DBRX基础版

DBRX基础版是Databricks从头训练的混合专家(MoE)大语言模型
我们在开放许可证下同时发布了预训练基础模型DBRX Base和用于多轮交互的微调版本DBRX Instruct
当前仓库为DBRX Base版本，DBRX Instruct模型请访问此处
完整技术细节请参阅我们的技术博客

模型概览

DBRX是基于Transformer架构的仅解码器大语言模型(LLM)，采用下一词预测方式训练。其特点包括：

采用细粒度混合专家架构，总参数量1320亿，其中360亿参数对任意输入激活
在12万亿文本和代码token上预训练
相比Mixtral-8x7B等开源MoE模型，DBRX使用16个专家选4的细粒度结构（其他模型多为8选2），专家组合可能性提升65倍
采用RoPE位置编码、GLU门控线性单元和GQA分组查询注意力机制
使用改进版GPT-4分词器（基于tiktoken实现）

训练数据方面：

使用32K上下文窗口在12万亿精选token上预训练
数据质量较MPT模型训练集提升2倍以上
采用Databricks全栈工具（Apache Spark™、Unity Catalog等）进行数据处理
通过课程学习策略动态调整数据混合比例

技术规格：

输入：纯文本，最大支持32768个token
输出：纯文本生成
架构细节：详见技术博客
许可证：Databricks开放模型许可证
版本：1.0
所有权：Databricks公司

使用方式

可通过以下途径使用DBRX模型：

HuggingFace下载（基础版当前仓库，指令微调版见此）
GitHub模型仓库访问
通过Databricks基础模型API使用企业级部署
使用LLM-Foundry进行微调（参见文档）

快速入门

注意：当前为未微调的基础版，仅支持文本补全任务
如需交互式聊天模型请使用DBRX Instruct

运行要求：

约264GB内存
安装transformers≥4.40.0：

pip install "transformers>=4.40.0"

加速下载（可选）：

pip install hf_transfer
export HF_HUB_ENABLE_HF_TRANSFER=1

多GPU运行示例：

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("databricks/dbrx-base", token="hf_YOUR_TOKEN")
model = AutoModelForCausalLM.from_pretrained("databricks/dbrx-base", 
                    device_map="auto", 
                    torch_dtype=torch.bfloat16,
                    token="hf_YOUR_TOKEN")

input_text = "Databricks成立于"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))