库名称: transformers
标签:
- mergekit
- 合并
基础模型:
- bunnycore/Phi-4-Stock-RP
- Pinkstack/SuperThoughts-CoT-14B-16k-o1-QwQ
- unsloth/phi-4
- bunnycore/Phi-4-Stock-RP
- bunnycore/Phi-4-RP-lora_model
- bunnycore/Phi-4-Stock-Ex
模型索引:
- 名称: Phi-4-Model-Stock-v2
结果:
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: IFEval (0样本)
类型: HuggingFaceH4/ifeval
参数:
num_few_shot: 0
指标:
- 类型: 实例级严格准确率和提示级严格准确率
值: 63.75
名称: 严格准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=bunnycore/Phi-4-Model-Stock-v2
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: BBH (3样本)
类型: BBH
参数:
num_few_shot: 3
指标:
- 类型: 标准化准确率
值: 54.69
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=bunnycore/Phi-4-Model-Stock-v2
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MATH 5级 (4样本)
类型: hendrycks/competition_math
参数:
num_few_shot: 4
指标:
- 类型: 精确匹配
值: 35.88
名称: 精确匹配
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=bunnycore/Phi-4-Model-Stock-v2
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: GPQA (0样本)
类型: Idavidrein/gpqa
参数:
num_few_shot: 0
指标:
- 类型: 标准化准确率
值: 13.2
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=bunnycore/Phi-4-Model-Stock-v2
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MuSR (0样本)
类型: TAUR-Lab/MuSR
参数:
num_few_shot: 0
指标:
- 类型: 标准化准确率
值: 17.57
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=bunnycore/Phi-4-Model-Stock-v2
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MMLU-PRO (5样本)
类型: TIGER-Lab/MMLU-Pro
配置: main
分割: test
参数:
num_few_shot: 5
指标:
- 类型: 准确率
值: 48.12
名称: 准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=bunnycore/Phi-4-Model-Stock-v2
名称: 开放LLM排行榜
合并
这是使用mergekit创建的预训练语言模型的合并。
合并详情
合并方法
该模型使用模型库存合并方法,以unsloth/phi-4为基础进行合并。
合并的模型
合并中包含以下模型:
配置
使用以下YAML配置生成该模型:
models:
- model: bunnycore/Phi-4-Stock-RP+bunnycore/Phi-4-RP-lora_model
- model: bunnycore/Phi-4-Stock-Ex
- model: Pinkstack/SuperThoughts-CoT-14B-16k-o1-QwQ
- model: bunnycore/Phi-4-Stock-RP
base_model: unsloth/phi-4
merge_method: model_stock
parameters:
normalize: true
dtype: bfloat16
tokenizer_source: unsloth/phi-4
详细结果可查看此处
指标 |
值 |
平均 |
38.87 |
IFEval (0样本) |
63.75 |
BBH (3样本) |
54.69 |
MATH 5级 (4样本) |
35.88 |
GPQA (0样本) |
13.20 |
MuSR (0样本) |
17.57 |
MMLU-PRO (5样本) |
48.12 |