C

Caplattessdolxaboros Yi 34B 200K DARE Ties HighDensity

由 brucethemoose 开发
这是一个基于Yi-34B-200K基础模型,通过DARE Ties方法合并多个同源模型的高密度合并模型,具有200K长上下文处理能力。
下载量 94
发布时间 : 12/9/2023
模型介绍
内容详情
替代品

模型简介

该模型通过mergekit的DARE Ties方法合并了Dolphin-2.2-yi-34b-200k、Nous-Capybara-34B、Tess-M-v1.4等多个同源模型,保留了Yi-34B-200K的长上下文能力,同时在多项基准测试中表现优异。

模型特点

长上下文处理
支持200K tokens的长上下文处理,适合处理长文档和复杂推理任务
高密度合并
采用DARE Ties方法以高于推荐密度合并多个同源模型,提升模型性能
多模型优势融合
整合了Dolphin、Capybara、Tess等多个模型的优势,具备多样化能力
高效推理
24GB GPU即可运行,在exllamav2上可支持45K-75K上下文长度

模型能力

文本生成
长文本理解
复杂推理
问答系统
知识问答

使用案例

知识问答
AI2推理挑战赛
在AI2推理挑战赛(ARC)上的少量样本表现
标准化准确率67.41
常识推理
HellaSwag测试
在HellaSwag数据集上的常识推理能力
标准化准确率85.77
数学推理
GSM8k数学问题
解决小学数学应用题的能力
准确率61.33