G

Granite 7b Base

由 ibm-granite 开发
IBM发布的基于Apache-2.0许可证的开源大语言模型,复现了Meta的Llama2-7B架构,使用2T token数据训练而成。
下载量 3,653
发布时间 : 4/19/2024
模型介绍
内容详情
替代品

模型简介

Granite-7b-base是IBM研究院开发的基础预训练大模型,作为Llama2-7B的开源参考实现,主要用于文本生成和理解任务。

模型特点

开源商业友好
采用Apache-2.0许可证,允许商业使用和修改
数据透明
公开了训练数据源和采样比例,促进研究透明度
大规模训练
基于2T token数据和100万批次规模训练

模型能力

英语文本生成
文本理解
代码生成(有限)
问答系统

使用案例

研究开发
语言模型基准测试
作为Llama2架构的开源实现参考
在MMLU等基准测试中接近原版性能
商业应用
内容生成辅助
用于生成初版文本内容