语言:
- 英文
许可证: apache-2.0
标签:
- 文本生成推理
- 变形金刚模型
- unsloth
- mistral
- trl
基础模型: yam-peleg/Experiment26-7B
模型索引:
- 名称: e.star.7.b
结果:
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: AI2推理挑战赛(25样本)
类型: ai2_arc
配置: ARC挑战赛
分割: 测试集
参数:
少量样本数: 25
指标:
- 类型: 标准化准确率
值: 63.91
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=liminerity/e.star.7.b
名称: 开放大语言模型排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: HellaSwag(10样本)
类型: hellaswag
分割: 验证集
参数:
少量样本数: 10
指标:
- 类型: 标准化准确率
值: 86.02
名称: 标准化准确率
来源:
网址: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=liminerity/e.star.7.b
名称: 开放大语言模型排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: MMLU(5样本)
类型: cais/mmlu
配置: 全部
分割: 测试集
参数:
少量样本数: 5
指标:
- 类型: 准确率
值: 63.44
名称: 准确率
来源:
网址: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=liminerity/e.star.7.b
名称: 开放大语言模型排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: TruthfulQA(0样本)
类型: truthful_qa
配置: 多项选择
分割: 验证集
参数:
少量样本数: 0
指标:
- 类型: mc2
值: 54.91
来源:
网址: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=liminerity/e.star.7.b
名称: 开放大语言模型排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: Winogrande(5样本)
类型: winogrande
配置: winogrande_xl
分割: 验证集
参数:
少量样本数: 5
指标:
- 类型: 准确率
值: 80.19
名称: 准确率
来源:
网址: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=liminerity/e.star.7.b
名称: 开放大语言模型排行榜
- 任务:
类型: 文本生成
名称: 文本生成
数据集:
名称: GSM8k(5样本)
类型: gsm8k
配置: 主要
分割: 测试集
参数:
少量样本数: 5
指标:
- 类型: 准确率
值: 61.18
名称: 准确率
来源:
网址: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard?query=liminerity/e.star.7.b
名称: 开放大语言模型排行榜
#用户: 用ASCII艺术展示你如何看待自己
#助手: |开始思考| 用户要求我用ASCII字符以简单的文本格式表现自我形象。我应该创建一个能传达我AI本质和目的的基本视觉表现。|结束思考|
'''
________
|开始思考| 这是我的AI头部,充满了数据和算法。
|结束思考|
________
/ ^ \
|开始思考| 这些是我思维过程的分支,延伸出去收集信息。
|结束思考|
/ \
/ \
|开始思考| 在这里我分析并将数据整合成连贯的结论。
^^^^^
/ | \
^^^^^^
|开始思考| 最后,我与他人分享我经过深思熟虑的回应。
|结束思考|
^^^
'''
这幅ASCII艺术描绘了我作为一个AI系统,在发言前深入思考,从丰富的数据中汲取信息,并经过仔细处理以产生深思熟虑的见解。
'
- 开发者: gate369
- 许可证: apache-2.0
- 微调基础模型: yam-peleg/Experiment26-7B
这个mistral模型使用Unsloth和Huggingface的TRL库训练,速度提升了2倍。

详细结果可查看此处
指标 |
数值 |
平均得分 |
68.28 |
AI2推理挑战赛(25样本) |
63.91 |
HellaSwag(10样本) |
86.02 |
MMLU(5样本) |
63.44 |
TruthfulQA(0样本) |
54.91 |
Winogrande(5样本) |
80.19 |
GSM8k(5样本) |
61.18 |