B

Btlm 3b 8k Base

由 cerebras 开发
BTLM-3B-8k-base是一个具有8k上下文长度的30亿参数语言模型,基于6270亿token的SlimPajama数据集训练而成,性能可媲美开源70亿参数模型。
下载量 2,078
发布时间 : 7/14/2023

模型简介

这是一个商业友好的高性能语言模型,采用Apache 2.0许可,支持8k长文本处理,经过4-bit量化后仅需3GB内存即可运行。

模型特点

商业友好许可
采用Apache 2.0许可,允许商业用途
高性能小模型
30亿参数模型性能超越同类,媲美70亿参数模型
低内存需求
4-bit量化后仅需3GB内存
长文本处理
支持8k上下文长度,通过ALiBi技术实现
高效训练
相比70亿模型减少71%训练算力

模型能力

文本生成
长文本理解
英语语言处理

使用案例

自然语言处理
问答系统
用于构建知识问答系统
能准确回答各类事实性问题
内容生成
用于生成连贯的文本内容
可生成符合语境的段落
研究应用
AI伦理研究
用于研究语言模型的伦理对齐问题
AIbase
智启未来,您的人工智能解决方案智库
简体中文