B

Bagel 8b V1.0

由 jondurbin 开发
基于Meta的Llama-3构建的8B参数模型,使用贝果数据集微调,采用单一的llama-3指令格式。
下载量 14.11k
发布时间 : 4/24/2024

模型简介

该模型是对llama-3-8b使用贝果数据集进行的微调版本,专注于指令跟随和上下文理解任务。

模型特点

单一指令格式
采用llama-3-instruct提示模板,简化了提示格式,提高了指令跟随的一致性。
多任务支持
支持问答、摘要生成、函数调用等多种任务,适用于广泛的应用场景。
高质量数据微调
使用贝果数据集进行微调,结合多种高质量数据源,提升了模型的性能和泛化能力。

模型能力

文本生成
指令跟随
问答
摘要生成
函数调用
思维链推理

使用案例

教育
问答系统
用于教育领域的问答系统,回答学生的问题并提供解释。
在MT-Bench中表现良好,平均得分7.296875。
内容生成
摘要生成
自动生成文本内容的摘要,适用于新闻、研究论文等。
支持约130字的摘要生成。
编程辅助
函数调用
根据用户输入生成函数调用代码,支持多种编程语言。
能够准确生成JSON格式的函数调用参数。
AIbase
智启未来,您的人工智能解决方案智库
简体中文