C

Cosmicbun 8B

由 aloobun 开发
CosmicBun-8B是基于Llama3-8B架构的合并模型,专注于数学、物理、化学和生物等科学领域的文本生成任务。
下载量 19
发布时间 : 5/1/2024
模型介绍
内容详情
替代品

模型简介

该模型通过合并多个Llama3-8B变体(包括dolphin-2.9、Einstein-v6.1和neural-chat-v1)而创建,旨在提升在科学相关任务上的表现。

模型特点

科学领域优化
专注于数学、物理、化学和生物等科学领域的文本生成能力
多模型合并
采用DARE/TIES方法合并多个Llama3-8B变体,结合各模型优势
分层参数配置
对不同模型层采用不同的密度和权重配置,优化模型性能

模型能力

文本生成
科学问题解答
数学推理
物理概念解释
化学知识问答
生物知识问答

使用案例

教育
科学问题解答
回答学生提出的数学、物理、化学和生物相关问题
在GSM8k数学推理任务上达到68.23%准确率
研究辅助
科学概念解释
帮助研究人员快速理解复杂科学概念
在MMLU综合知识测试中达到65.53%准确率