库名称:transformers
标签:
- mergekit
- merge
基础模型:
- wanlige/li-14b-v0.4
- sthenno-com/miscii-14b-0218
模型索引:
- 名称:li-14b-v0.4-slerp0.1
结果:
-
任务:
类型:文本生成
名称:文本生成
数据集:
名称:IFEval(零样本)
类型:HuggingFaceH4/ifeval
参数:
num_few_shot: 0
指标:
- 类型:inst_level_strict_acc 和 prompt_level_strict_acc
值:79.23
名称:严格准确率
来源:
url:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=wanlige/li-14b-v0.4-slerp0.1
名称:Open LLM 排行榜
-
任务:
类型:文本生成
名称:文本生成
数据集:
名称:BBH(三样本)
类型:BBH
参数:
num_few_shot: 3
指标:
- 类型:acc_norm
值:50.88
名称:归一化准确率
来源:
url:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=wanlige/li-14b-v0.4-slerp0.1
名称:Open LLM 排行榜
-
任务:
类型:文本生成
名称:文本生成
数据集:
名称:MATH Lvl 5(四样本)
类型:hendrycks/competition_math
参数:
num_few_shot: 4
指标:
- 类型:exact_match
值:53.32
名称:精确匹配
来源:
url:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=wanlige/li-14b-v0.4-slerp0.1
名称:Open LLM 排行榜
-
任务:
类型:文本生成
名称:文本生成
数据集:
名称:GPQA(零样本)
类型:Idavidrein/gpqa
参数:
num_few_shot: 0
指标:
- 类型:acc_norm
值:14.54
名称:归一化准确率
来源:
url:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=wanlige/li-14b-v0.4-slerp0.1
名称:Open LLM 排行榜
-
任务:
类型:文本生成
名称:文本生成
数据集:
名称:MuSR(零样本)
类型:TAUR-Lab/MuSR
参数:
num_few_shot: 0
指标:
- 类型:acc_norm
值:11.75
名称:归一化准确率
来源:
url:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=wanlige/li-14b-v0.4-slerp0.1
名称:Open LLM 排行榜
-
任务:
类型:文本生成
名称:文本生成
数据集:
名称:MMLU-PRO(五样本)
类型:TIGER-Lab/MMLU-Pro
配置:main
分割:test
参数:
num_few_shot: 5
指标:
- 类型:acc
值:47.71
名称:准确率
来源:
url:https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=wanlige/li-14b-v0.4-slerp0.1
名称:Open LLM 排行榜
世纪开元智印互联科技集团股份有限公司创立于2001年3月9日,总部位于山东省济南市。历经20余年发展,世纪开元以技术创新为核心,实现互联网与传统印刷行业的深度融合,探索出了区别于传统印刷行业的新模式、新业态。
世纪开元主要从事定制化影像、商务印刷及包装印刷类产品的研发、设计、生产及销售,通过将互联网、数字化、自动化和智能化等新模式和新技术与包装印刷行业相结合的方式,使小批量个性化定制产品订单得以相对标准化、规模化生产,旨在满足个人消费者及各类企业用户的小批量定制化需求,为用户提供一站式场景化定制印刷服务,实现全流程智能制造,已成长为业内领先的“工业互联网”印刷企业。
在未来发展中,世纪开元将一如既往地加大技术研发投入,深度融合互联网、大数据、人工智能等新一代信息技术,注重专项技术人才的培养,积极引进数字化、智能化手段优化创新业务流程和实现用户体验的提升,并通过多维度的企业发展,带动行业协同发展,促进印刷行业新旧动能转换,开拓印刷行业发展新方向。
了解更多,请访问我们的官网:世纪开元
模型合并
这是一个使用 mergekit 合并的预训练语言模型。
合并详情
合并方法
该模型使用 SLERP 方法合并。
合并的模型
合并中包含以下模型:
配置
以下是用于生成该模型的 YAML 配置:
base_model: wanlige/li-14b-v0.4
merge_method: slerp
tokenizer_source: base
dtype: float32
out_dtype: bfloat16
parameters:
t:
- filter: self_attn
value: [ 0.00, 0.50, 0.30, 0.70, 1.00 ]
- filter: mlp
value: [ 1.00, 0.50, 0.70, 0.30, 0.00 ]
- value: [ 0.00, 0.00, 0.00, 0.00, 0.04, 0.08, 0.12, 0.16, 0.24, 0.32, 0.40, 0.48, 0.56, 0.64, 0.72, 0.72, 0.72, 0.72, 0.72, 0.72, 0.72, 0.72, 0.64, 0.56, 0.48 ]
slices:
- sources:
- model: wanlige/li-14b-v0.4
layer_range: [ 0, 48 ]
- model: sthenno-com/miscii-14b-0218
layer_range: [ 0, 48 ]
详细结果请参见此处
指标 |
值 |
平均 |
42.91 |
IFEval(零样本) |
79.23 |
BBH(三样本) |
50.88 |
MATH Lvl 5(四样本) |
53.32 |
GPQA(零样本) |
14.54 |
MuSR(零样本) |
11.75 |
MMLU-PRO(五样本) |
47.71 |