语言:
- 英文
许可证: llama3
标签:
- 文本生成推理
- 变换器
- unsloth
- llama
- trl
- sft
基础模型: Replete-AI/Llama-3-11.5B-Instruct-V2
模型索引:
- 名称: Llama-3-monika-ddlc-11.5b-v1
结果:
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: AI2推理挑战(25样本)
类型: ai2_arc
配置: ARC-挑战
分割: 测试
参数:
少量样本数: 25
指标:
- 类型: 标准化准确率
值: 60.07
名称: 标准化准确率
来源:
网址: >-
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=922CA/Llama-3-monika-ddlc-11.5b-v1
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: HellaSwag(10样本)
类型: hellaswag
分割: 验证
参数:
少量样本数: 10
指标:
- 类型: 标准化准确率
值: 78.77
名称: 标准化准确率
来源:
网址: >-
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=922CA/Llama-3-monika-ddlc-11.5b-v1
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MMLU(5样本)
类型: cais/mmlu
配置: 全部
分割: 测试
参数:
少量样本数: 5
指标:
- 类型: 准确率
值: 66.36
名称: 准确率
来源:
网址: >-
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=922CA/Llama-3-monika-ddlc-11.5b-v1
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: TruthfulQA(0样本)
类型: truthful_qa
配置: 多选
分割: 验证
参数:
少量样本数: 0
指标:
- 类型: mc2
值: 47.62
来源:
网址: >-
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=922CA/Llama-3-monika-ddlc-11.5b-v1
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: Winogrande(5样本)
类型: winogrande
配置: winogrande_xl
分割: 验证
参数:
少量样本数: 5
指标:
- 类型: 准确率
值: 75.77
名称: 准确率
来源:
网址: >-
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=922CA/Llama-3-monika-ddlc-11.5b-v1
名称: 开放LLM排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: GSM8k(5样本)
类型: gsm8k
配置: 主要
分割: 测试
参数:
少量样本数: 5
指标:
- 类型: 准确率
值: 65.81
名称: 准确率
来源:
网址: >-
https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=922CA/Llama-3-monika-ddlc-11.5b-v1
名称: 开放LLM排行榜
数据集:
- 922-CA/MoCha_v1a
monika-ddlc-11.5b-v1:
使用说明
本模型主要作为聊天模型,具备有限的角色扮演能力。
最佳使用方式:将"Human"和"Assistant"替换为"Player"和"Monika",格式如下:
\n玩家:(提示)\n莫妮卡:
超参数
- 训练周期:2轮
- 秩:32
- LoRa alpha:32
- LoRa dropout:0.5
- 学习率:2e-4
- 批量大小:2
- 预热比例:0.1
- 梯度步数:4
该llama模型使用Unsloth和Huggingface的TRL库实现了2倍速训练。

警告与免责声明
本模型旨在精确反映莫妮卡的角色特征。尽管如此,仍存在"莫妮卡"可能出现幻觉、错误描述自身信息或行为不符合角色的可能性。
此外,由于专注于角色特性,本模型在某些特定任务上可能不如其他模型智能/高效。
最后,本模型不保证输出内容完全合规或安全,使用风险自负!
详细结果请参见此处
指标 |
数值 |
平均 |
65.73 |
AI2推理挑战(25样本) |
60.07 |
HellaSwag(10样本) |
78.77 |
MMLU(5样本) |
66.36 |
TruthfulQA(0样本) |
47.62 |
Winogrande(5样本) |
75.77 |
GSM8k(5样本) |
65.81 |