Llama3.1-1B-Neo-BAAI-1000k开源语言模型 - 高效文本处理，基于百万数据训练

Llama3.1 1B Neo BAAI 1000k

由 yang31210999 开发

Llama3.1-Neo-1B-100w是基于Meta-Llama-3.1-8B-Instruct剪枝至1.4B参数规模，并采用LLM-Neo方法（结合LoRA与知识蒸馏）微调的高效语言模型。训练数据采样自BAAI/Infinity-Instruct的100万行数据。

下载量 39

发布时间 : 9/10/2024

模型简介

该模型是一个高效参数知识蒸馏后的大型语言模型，专注于文本生成任务，适用于多种自然语言处理场景。

高效参数知识蒸馏

采用LLM-Neo方法结合LoRA与知识蒸馏技术，显著减少模型参数量的同时保持性能

轻量化设计

从8B参数剪枝至1.4B，大幅降低计算资源需求

高质量微调数据

使用BAAI/Infinity-Instruct数据集中的精选100万行数据进行微调

文本生成

问答系统

指令跟随

知识推理

教育

学术问答系统

用于回答学生提出的各类学术问题

在CEVAL高等数学子集上达到31.58%准确率

商业

会计知识问答

处理基础会计相关问题

在CEVAL会计子集上达到24.49%准确率

通用AI助手

日常问题解答

回答日常生活中的各种问题

在PIQA基准测试中达到58.43%准确率

类别	基准测试	版本	指标	值	标准误差
ARC	ARC - Challenge	1	acc	0.1920	± 0.0115
ARC	ARC - Easy	1	acc	0.3834	± 0.0100
CEVAL	CEVAL (valid)	N/A	acc	0.2370	± 0.0117
CEVAL	CEVAL (Accountant)	1	acc	0.2449	± 0.0621
CEVAL	CEVAL (Advanced Mathematics)	1	acc	0.3158	± 0.1096
MMLU	MMLU	N/A	acc	0.2439	± 0.0036
MMLU	MMLU (Abstract Algebra)	0	acc	0.2500	± 0.0435
PIQA	PIQA	1	acc	0.5843	± 0.0115
PIQA	PIQA (Normalized)	1	acc_norm	0.5822	± 0.0115
Winogrande	Winogrande	1	acc	0.5249	± 0.0140