F

Fusellm 7B

由 Wanfq 开发
FuseLLM-7B是一个融合了多个开源大型语言模型知识的统一模型,通过知识融合技术将不同架构的LLM能力整合到一个模型中。
下载量 45
发布时间 : 1/21/2024
模型介绍
内容详情
替代品

模型简介

FuseLLM-7B通过融合Llama-2-7B、OpenLLaMA-7B和MPT-7B三个不同架构的模型,实现了知识整合和能力增强。该模型在多个基准测试中表现出色,适用于文本生成、推理等多种任务。

模型特点

多模型知识融合
整合了Llama-2-7B、OpenLLaMA-7B和MPT-7B三个不同架构模型的知识和能力
跨架构支持
能够融合不同架构的模型,突破了传统模型融合的限制
性能提升
在多个基准测试中表现优于单个源模型
轻量级训练
通过轻量级持续训练实现知识转移,训练效率高

模型能力

文本生成
常识推理
代码生成
问答系统
阅读理解
机器翻译

使用案例

自然语言处理
智能问答系统
用于构建能够回答复杂问题的问答系统
在TruthfulQA基准上达到38.17的mc2分数
代码生成
支持多语言编程代码生成
在MultiPL-E基准上达到15.56的分数
教育辅助
科学问题解答
帮助学生解答科学和数学问题
在GSM8k数学基准上达到14.33的准确率