M

MISTRALNEURAL 7B Slerp

由 EdBerg 开发
MISTRALNEURAL-7B-slerp是通过mergekit工具融合Mistral-7B和Neural-Chat-7B两个模型而成的7B参数大语言模型
下载量 15
发布时间 : 3/29/2024
模型介绍
内容详情
替代品

模型简介

使用slerp球面线性插值方法融合Mistral-7B基础模型和Neural-Chat-7B对话模型,兼具基础语言能力和对话优化

模型特点

模型融合技术
采用slerp球面线性插值方法精细融合两个7B模型的参数
双模型优势结合
结合Mistral-7B的基础语言能力和Neural-Chat-7B的对话优化
分层融合策略
对不同网络层(自注意力层和MLP)采用不同的融合权重配置

模型能力

文本生成
对话交互
指令跟随

使用案例

对话系统
智能助手
可用于构建具有自然对话能力的AI助手
内容生成
创意写作
辅助进行故事创作和内容生成