Rombos-LLM-V2.5-Qwen-72b开源AI模型 - 融合模型性能更优，免费好用！

Rombos LLM V2.5 Qwen 72b

由 rombodawg 开发

Rombos-LLM-V2.5-Qwen-72b是Qwen2.5-72B的持续微调版本，通过特定方法融合指令模型和基础模型，展现出更优的性能。

下载量 1,160

发布时间 : 9/30/2024

模型简介

该模型是基于Qwen2.5-72B-Instruct的持续微调版本，通过Ties合并方法将指令模型与基础模型进行合并，性能优于原始模型。

持续微调

使用Ties合并方法将指令模型与基础模型进行合并，性能优于原始模型。

多格式支持

支持GGUF格式，EXL2格式也在计划中。

量化支持

量化版本即将推出，适合不同硬件需求。

文本生成

指令跟随

多轮对话

通用任务

指令生成

根据用户指令生成高质量文本

在IFEval (0-Shot)中达到71.55的严格准确率

复杂问题解答

回答复杂数学和科学问题

在MATH Lvl 5 (4-Shot)中达到47.58的精确匹配率

专业领域

专业问答

回答专业领域问题

在MMLU-PRO (5-shot)中达到54.83的准确率

Rombos-LLM-V2.5-Qwen-72b是Qwen2.5-72B的持续微调版本。该模型通过特定方法融合指令模型和基础模型，相比原始的指令模型和基础模型，展现出更优的性能。

image/jpeg

属性	详情
库名称	transformers
基础模型	Qwen/Qwen2.5-72B-Instruct
许可证名称	qwen
许可证链接	https://huggingface.co/Qwen/Qwen2.5-72B-Instruct/blob/main/LICENSE

模型名称：Replete-LLM-V2.5-Qwen-72b_Duplicated
评估任务：文本生成
评估数据集及结果：
1. IFEval (0-Shot)：
  - 数据集类型：HuggingFaceH4/ifeval
  - 评估指标：严格准确率（inst_level_strict_acc and prompt_level_strict_acc）为71.55
  - 数据来源：Open LLM Leaderboard
2. BBH (3-Shot)：
  - 数据集类型：BBH
  - 评估指标：归一化准确率（acc_norm）为61.27
  - 数据来源：Open LLM Leaderboard
3. MATH Lvl 5 (4-Shot)：
  - 数据集类型：hendrycks/competition_math
  - 评估指标：精确匹配率（exact_match）为47.58
  - 数据来源：Open LLM Leaderboard
4. GPQA (0-shot)：
  - 数据集类型：Idavidrein/gpqa
  - 评估指标：归一化准确率（acc_norm）为19.8
  - 数据来源：Open LLM Leaderboard
5. MuSR (0-shot)：
  - 数据集类型：TAUR-Lab/MuSR
  - 评估指标：归一化准确率（acc_norm）为17.32
  - 数据来源：Open LLM Leaderboard
6. MMLU-PRO (5-shot)：
  - 数据集类型：TIGER-Lab/MMLU-Pro
  - 评估指标：准确率（acc）为54.83
  - 数据来源：Open LLM Leaderboard