M

Mamba 2.8b Instruct Openhermes

由 clibrain 开发
这是一个基于OpenHermes数据集微调的28亿参数MAMBA模型,采用新型状态空间架构,擅长文本生成任务。
下载量 202
发布时间 : 12/12/2023
模型介绍
内容详情
替代品

模型简介

该模型是基于MAMBA架构的指令微调模型,专门针对文本生成任务优化,使用OpenHermes数据集进行训练。

模型特点

高效架构
采用MAMBA状态空间模型架构,相比传统Transformer具有更高的计算效率
高质量训练数据
使用OpenHermes数据集训练,包含24.2万条GPT-4生成的高质量指令数据
开源许可
采用WTFPL许可证,允许自由使用和修改

模型能力

文本生成
指令跟随
对话生成

使用案例

旅游推荐
旅游景点推荐
根据用户请求生成旅游景点推荐
可生成包含5个景点的详细推荐列表
通用问答
知识问答
回答用户提出的各类知识性问题
能提供准确、详细的回答