1

14B

由 CausalLM 开发
14B参数规模的因果语言模型,完全兼容Meta LLaMA 2架构,在多项基准测试中超越70B以下模型
下载量 236
发布时间 : 10/22/2023
模型介绍
内容详情
替代品

模型简介

基于Qwen和LLaMA2架构训练的大语言模型,专注于文本生成任务,支持中英双语,在学术基准测试中表现优异

模型特点

高性能表现
在MMLU、CEval等基准测试中超越所有70B以下模型,GSM8K数学推理超越MetaMath-13B和Qwen-14B
多语言支持
支持中英双语,日语基准测试接近日文SOTA模型水平
完全兼容性
完全兼容LLaMA2架构,支持GGUF、GPTQ和AWQ量化格式
高质量训练数据
13亿token的SFT数据集,90%语句经过人工/合成改写,融合维基百科等多源精选内容

模型能力

文本生成
数学推理
多语言理解
学术问答

使用案例

学术研究
STEM领域问答
解答科学、技术、工程和数学领域的问题
MMLU STEM准确率64.19,超越所有70B以下模型
教育辅助
数学问题解答
解决复杂的数学推理问题
GSM8K零样本数学推理准确率70.13%