M

Mistral 7B Instruct V0.2 Sparsity 30 V0.1

由 wang7776 开发
Mistral-7B-Instruct-v0.2是基于Mistral-7B-Instruct-v0.1增强的指令微调大语言模型,采用Wanda剪枝方法实现30%稀疏化,无需重新训练即可保持竞争力性能。
下载量 75
发布时间 : 1/17/2024
模型介绍
内容详情
替代品

模型简介

这是一个指令微调的大语言模型,专门优化了对话和指令跟随能力,适用于需要自然语言理解和生成的场景。

模型特点

Wanda剪枝技术
采用Wanda剪枝方法实现30%稀疏化,无需重新训练或权重更新即可保持竞争力性能
增强指令微调
相比v0.1版本进行了指令微调增强,优化了对话和指令跟随能力
高效注意力机制
采用分组查询注意力和滑动窗口注意力机制,提高计算效率

模型能力

自然语言理解
文本生成
对话系统
指令跟随

使用案例

对话系统
智能助手
构建能够理解并回应用户查询的智能对话助手
能够生成自然流畅的对话响应
内容生成
创意写作
生成故事、诗歌等创意文本内容