K

K2

由 LLM360 开发
K2是一个650亿参数规模的大语言模型,通过完全透明化的训练方案,以35%计算量优势超越Llama 2 70B。
下载量 109
发布时间 : 4/17/2024
模型介绍
内容详情
替代品

模型简介

K2是由MBZUAI、Petuum和LLM360联合开发的大语言模型,采用两阶段训练流程,支持英语文本生成任务。

模型特点

完全透明化
开源所有训练资源,包括代码、数据、模型检查点和中间结果
高效训练
以35%计算量优势超越Llama 2 70B
两阶段训练
采用优化的两阶段训练流程
全面评估
提供涵盖通用领域和垂直领域的系统评估方案

模型能力

英语文本生成
医学知识问答
数学问题求解
编程代码生成

使用案例

知识问答
通用知识问答
回答各类常识性问题
在IFEval评估中获得22.52标准分
专业领域
医学知识应用
处理医学相关问题和文献
在医学评估中获得8.55标准分
法律文本处理
分析和生成法律相关文本
使用pile-of-law数据集训练
技术应用
编程辅助
生成和补全代码
使用starcoder数据集训练
数学问题求解
解决复杂数学问题
在Math Lvl 5评估中获得2.04标准分