M

Mistral Supra

由 TRI-ML 开发
Mistral-SUPRA是基于Mistral-7B初始化的线性RNN模型,兼具Transformer和循环模型的功能。
下载量 163
发布时间 : 4/9/2024

模型简介

该模型通过特定训练过程将Mistral-7B转化为线性RNN,支持在推理时选择并行或循环模式,适用于文本生成任务。

模型特点

线性RNN架构
将Mistral-7B转化为线性RNN,兼具Transformer和循环模型的功能
双模式推理
支持并行和循环两种推理模式,可根据需求选择
高效训练
在100B标记的数据集上仅需1.5天完成训练

模型能力

文本生成
语言理解

使用案例

自然语言处理
文本补全
根据给定文本片段生成连贯的后续内容
示例输出:'Machine learning is a branch of artificial intelligence (AI) that enables computers to learn from experience...'
AIbase
智启未来,您的人工智能解决方案智库
简体中文