M

Mistrallite

由 amazon 开发
MistralLite是基于Mistral-7B-v0.1微调的语言模型,增强了处理长上下文(最高达32K tokens)的能力,适用于长上下文检索与问答等场景。
下载量 20.24k
发布时间 : 10/16/2023

模型简介

MistralLite是一个优化了长上下文处理能力的语言模型,通过改进的旋转位置编码和滑动窗口技术,显著提升了在长上下文任务中的表现,同时保持了原模型的简洁结构。

模型特点

长上下文处理
支持最高32K tokens的上下文长度,通过改进的旋转位置编码和滑动窗口技术优化长上下文处理能力。
性能提升
在多项长上下文检索与问答任务中表现显著提升,如主题检索、行检索等。
资源高效
可在单台AWS g5.2x实例上部署,适合资源受限环境下的高性能需求。

模型能力

长上下文文本生成
主题检索
行检索
密钥检索
长文本问答
摘要生成

使用案例

信息检索
主题检索
在长文档中检索特定主题的信息
在2851至13780 tokens的测试中,准确率从98%到100%不等
行检索
在长文档中检索特定行的信息
在3818至12657 tokens的测试中,准确率从60%到98%不等
问答系统
长文本问答
基于长文档内容回答复杂问题
测试集准确率64.4%,困难子集准确率56.2%
AIbase
智启未来,您的人工智能解决方案智库
简体中文