B

Buddhi 128k Chat 7b

由 aiplanet 开发
Buddhi-128k-Chat 是一款具有 128K 上下文窗口的通用首款聊天模型,基于 Mistral 7B Instruct 进行了精细微调,并通过创新的 YaRN 技术优化,可处理长达 128,000 个标记的扩展上下文长度。
下载量 196
发布时间 : 4/2/2024
模型介绍
内容详情
替代品

模型简介

Buddhi-128k-Chat 是一款具有 128K 上下文窗口的通用首款聊天模型。它基于 Mistral 7B Instruct 进行了精细微调,并通过创新的 YaRN(Yet another Rope Extension)技术优化,可处理长达 128,000 个标记的扩展上下文长度。这一增强功能使 Buddhi 能够在长文档或对话中保持对上下文的深入理解,尤其擅长需要广泛上下文保留的任务,如全面的文档摘要、详细的叙事生成和复杂的问答。

模型特点

128K 上下文窗口
通过 YaRN 技术扩展了上下文窗口至 128K,能够处理超长文本和复杂对话
基于 Mistral-7B Instruct 微调
继承了 Mistral-7B Instruct 的卓越推理能力,并在长上下文任务上进行了优化
动态 YaRN 技术
采用 NTK-aware 动态调整技术,有效扩展了位置嵌入能力

模型能力

长文本理解
复杂对话处理
文档摘要
叙事生成
问答系统

使用案例

文档处理
长文档摘要
对超长文档进行全面的摘要生成
能够在 128K 上下文窗口内保持对文档内容的准确理解
整本书分析
对整本书籍内容进行分析和问答
可处理长达 75000 标记的书籍内容
对话系统
复杂对话
处理包含大量上下文的复杂对话
在长对话中保持上下文一致性