Y

Yarn Mistral 7B 128k AWQ

由 TheBloke 开发
Yarn Mistral 7B 128K是一款针对长上下文优化的先进语言模型,通过YaRN扩展方法在长上下文数据上进一步预训练,支持128k令牌的上下文窗口。
下载量 483
发布时间 : 11/2/2023
模型介绍
内容详情
替代品

模型简介

基于Mistral-7B-v0.1扩展的语言模型,专门针对处理长上下文进行了优化,适用于需要处理超长文本的各种自然语言处理任务。

模型特点

超长上下文支持
支持128k令牌的上下文窗口,能够处理超长文本内容。
高效量化
提供AWQ量化版本,在保持质量的同时提高推理效率。
优化预训练
通过YaRN方法在长上下文数据上进行了1500步的额外预训练。

模型能力

长文本生成
上下文理解
文本续写
问答系统

使用案例

文档处理
长文档摘要
对超长文档进行内容摘要和关键信息提取。
法律文档分析
处理和分析复杂的法律合同和条款。
代码处理
代码库分析
理解大型代码库的结构和功能。