语言:
- 英文
许可证: llama3
库名称: transformers
管道标签: 文本生成
模型索引:
- 名称: orca_mini_v5_8b_dpo
结果:
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: IFEval (零样本)
类型: HuggingFaceH4/ifeval
参数:
零样本数量: 0
指标:
- 类型: 实例级严格准确率和提示级严格准确率
值: 48.96
名称: 严格准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=pankajmathur/orca_mini_v5_8b_dpo
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: BBH (三样本)
类型: BBH
参数:
少样本数量: 3
指标:
- 类型: 标准化准确率
值: 29.61
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=pankajmathur/orca_mini_v5_8b_dpo
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MATH 五级 (四样本)
类型: hendrycks/competition_math
参数:
少样本数量: 4
指标:
- 类型: 精确匹配
值: 7.48
名称: 精确匹配
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=pankajmathur/orca_mini_v5_8b_dpo
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: GPQA (零样本)
类型: Idavidrein/gpqa
参数:
零样本数量: 0
指标:
- 类型: 标准化准确率
值: 3.24
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=pankajmathur/orca_mini_v5_8b_dpo
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MuSR (零样本)
类型: TAUR-Lab/MuSR
参数:
零样本数量: 0
指标:
- 类型: 标准化准确率
值: 6.94
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=pankajmathur/orca_mini_v5_8b_dpo
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MMLU-PRO (五样本)
类型: TIGER-Lab/MMLU-Pro
配置: 主要
分割: 测试
参数:
少样本数量: 5
指标:
- 类型: 准确率
值: 23.51
名称: 准确率
来源:
网址: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=pankajmathur/orca_mini_v5_8b_dpo
名称: 开放LLM排行榜
模型名称: llama_3_orca_mini_v5_8b_dpo
llama_3_orca_mini_v5_8b 使用多种DPO数据集训练
"痴迷于生成式AI的潜力?我也是!让我们一起创造 🚀 https://www.linkedin.com/in/pankajam"
声明
在提供适当的署名和归属后,您被授予使用此模型作为进一步全微调、DPO、PPO或ORPO调优以及任何合并的基础的权限。
我积极鼓励用户根据自己的特定需求定制和增强模型,因为此版本设计为一个全面的通用模型。
深入探索并创新吧!
评估
指标 |
值 |
平均 |
67.78 |
AI2推理挑战 (25样本) |
61.86 |
HellaSwag (10样本) |
82.35 |
MMLU (5样本) |
65.10 |
TruthfulQA (零样本) |
56.24 |
Winogrande (5样本) |
73.40 |
GSM8k (5样本) |
67.70 |