标签:
- unsloth
基础模型:
- THUDM/GLM-4-32B-0414
许可证: mit
语言:
- 中文
- 英语
管道标签: 文本生成
库名称: transformers
Unsloth Dynamic 2.0 实现了卓越的准确性,并优于其他领先的量化方法。
GLM-4-32B-0414
简介
GLM家族迎来新成员——GLM-4-32B-0414系列模型,拥有320亿参数。其性能可与OpenAI的GPT系列和DeepSeek的V3/R1系列相媲美。同时支持非常友好的本地部署特性。GLM-4-32B-Base-0414基于15T的高质量数据进行了预训练,其中包含大量推理型合成数据。这为后续的强化学习扩展奠定了基础。在后训练阶段,我们针对对话场景进行了人类偏好对齐。此外,通过拒绝采样和强化学习等技术,我们增强了模型在指令遵循、工程代码和函数调用方面的表现,从而强化了智能体任务所需的原子能力。GLM-4-32B-0414在工程代码、Artifact生成、函数调用、基于搜索的问答和报告生成等方面取得了良好的效果。特别是在代码生成或特定问答任务等多项基准测试中,GLM-4-32B-Base-0414与GPT-4o和DeepSeek-V3-0324(671B)等更大规模的模型表现相当。
GLM-Z1-32B-0414是一款具备深度思考能力的推理模型。这是基于GLM-4-32B-0414通过冷启动、扩展强化学习以及在数学、代码和逻辑等任务上的进一步训练开发而成。与基础模型相比,GLM-Z1-32B-0414显著提升了数学能力和解决复杂任务的能力。在训练过程中,我们还引入了基于成对排序反馈的通用强化学习,从而增强了模型的通用能力。
GLM-Z1-Rumination-32B-0414是一款具备反刍能力的深度推理模型(对标OpenAI的深度研究)。与典型的深度思考模型不同,反刍模型能够进行更深层次和更长时间的思考,以解决更开放和复杂的问题(例如,撰写两座城市人工智能发展的比较分析及其未来发展计划)。Z1-Rumination通过扩展端到端强化学习,由真实答案或评分标准对响应进行分级训练而成,并能在深度思考过程中利用搜索工具处理复杂任务。该模型在研究式写作和复杂任务方面表现出显著提升。
最后,GLM-Z1-9B-0414是一个惊喜。我们采用了上述所有技术训练了一个小型模型(9B)。GLM-Z1-9B-0414在数学推理和通用任务上展现出卓越的能力。其整体表现在同规模的开源模型中名列前茅。特别是在资源受限的场景下,该模型在效率和效果之间实现了出色的平衡,为寻求轻量级部署的用户提供了强有力的选择。
展示
动画生成
GLM-Z1-32B-0414
|
GLM-4-32B-0414
|
编写一个Python程序,展示一个球在旋转的六边形内弹跳。球应受重力和摩擦力影响,并且必须真实地从旋转的墙壁上反弹。
|
使用HTML模拟一个小球从旋转六边形中心释放的场景。考虑小球与六边形边缘的碰撞、作用于小球的重力,并假设所有碰撞均为完全弹性碰撞。(提示由中文翻译)
|
网页设计
GLM-4-32B-0414
|
GLM-4-32B-0414
|
设计一个支持自定义函数绘制的绘图板,允许添加和删除自定义函数,并为函数分配颜色。(提示由中文翻译)
|
设计一个移动机器学习平台的UI,应包括训练任务、存储管理和个人统计界面。个人统计界面应使用图表显示用户在一段时间内的资源使用情况。使用Tailwind CSS设计页面样式,并将这三个移动界面平铺在一个HTML页面上。(提示由中文翻译)
|
SVG生成
GLM-4-32B-0414
|
GLM-4-32B-0414
|
使用SVG创建一幅烟雨江南的场景。(提示由中文翻译)
|
使用SVG展示LLM的训练过程。(提示由中文翻译)
|
基于搜索的写作
对于基于搜索的写作任务,我们使用以下系统提示让模型根据搜索结果进行回答:
请根据所给搜索返回结果对用户问题进行作答。
## 注意
1. 充分利用和整理收集到的信息,而不是简单的复制粘贴,生成符合用户要求且有深度的专业答案。
2. 所提供信息充分的情况下,你的回答需尽可能延长,从用户意图角度出发,提供具有足够信息量和多角度的回复。
3. 另外,并非所有的搜索结果都与用户问题密切相关,请仔细的甄别、筛选和利用。
4. 客观类问答的答案通常非常简短,你可以适当补充一到两句相关信息,以丰富内容。
5. 请确保你的回复格式美观、可读性强。对于多实体对比或列举,善用列表格式来帮助用户更好的理解信息。
6. 除非用户要求,否则你回答的语言请于用户提问语言保持一致。
7. 在适当情况下在句子末尾使用例如:【0†source】的格式引用搜索结果。
使用时,可以通过RAG
或WebSearch
等方法获取搜索结果,并包装在observation
中,例如:
[
{
"role": "user",
"content": "探索儿童文学的共同特征,重点关注其叙事技巧和主题倾向。这包括叙事技巧:儿童文学中的常见方法,如第一人称、第三人称、全知叙述者和互动叙事,以及它们对年轻读者的影响。还包括主题倾向:儿童文学中反复出现的主题,如成长、冒险、友谊和家庭,并分析这些主题如何影响儿童的认知和情感发展。此外,还应考虑其他普遍特征,如拟人化、重复语言、象征和隐喻的使用以及教育价值。请根据学术研究、儿童文学经典案例和专家意见提供详细的分析报告。"
},
{
"role": "observation",
"content": "【{id}†{title}†{url}】\n{content}"
},
...
]
对于上述提示,我们使用内部或外部搜索模型获取搜索结果。使用上述格式,我们可以生成以下分析报告:
儿童文学共同特征分析报告
儿童文学作为一种专为儿童创作的文学体裁,具有独特的艺术特征和表现手法。本报告将从叙事方法、主题倾向和其他普遍特征三个维度,综合学术研究、儿童文学经典案例和专家观点,全面分析儿童文学的共同特征。
叙事方法及其对儿童读者的影响
儿童文学的叙事方法呈现出多样化的特点,包括第一人称、第三人称、叙述和互动叙事等。这些不同的叙事视角和方法深刻影响着儿童的阅读体验和认知发展。
第一人称叙事在儿童文学中较为常见,以儿童主人公的视角展开故事。这种叙事方式拉近了读者与故事的距离,使儿童读者更容易产生代入感和情感共鸣。例如,许多成长小说采用第一人称叙事,让主人公直接讲述自己的经历和感受,使读者仿佛与主人公一同经历成长的喜怒哀乐。这种叙事视角赋予作品强烈的真实感和亲切感,有助于培养儿童的共情能力【1†source】。
第三人称叙事提供了更广阔的视角,作者可以灵活切换不同人物的视角,呈现更丰富的故事层次。在儿童文学中,第三人称全知叙事使作者能够掌控叙事节奏,根据需要揭示或隐藏信息,引导儿童的注意力。同时,第三人称叙事便于作者直接与读者对话,通过叙述传达价值观或解释复杂概念。这种叙事方法对儿童的宏观思维和综合理解能力有积极影响【1†source】。
**叙述(作者介入)**是儿童文学特有的叙事技巧,作者直接以"讲故事的人"身份出现,解释背景、评论人物或向读者提问。这种技巧在经典童话中尤为常见,如《安徒生童话》的开篇:"从前,有一个孩子..."叙述有助于儿童理解故事背景,填补认知空白,传达作者的教育意图。研究表明,适当的作者介入有助于儿童把握故事结构,提高阅读理解能力【5†source】。
互动叙事是当代儿童文学的新趋势,在数字媒体时代尤为突出。互动叙事打破了传统的单向作者-读者关系,鼓励儿童读者参与故事创作,如选择情节走向、人物对话或结局。这种参与式阅读增强了儿童的主体意识,培养了决策能力和创造性思维。例如,一些儿童阅读应用融入互动元素,儿童通过点击、拖拽等操作影响故事发展,从而获得更强的沉浸感和成就感【6†source】。互动叙事使儿童从被动的信息接收者转变为主动的意义建构者,对儿童主体性的发展具有独特贡献。
表:儿童文学常见叙事方法及其效果
叙事方法 |
特点 |
对儿童读者的影响 |
经典案例 |
第一人称 |
以儿童主人公视角讲述 |
增强代入感,培养共情能力 |
《夏洛的网》、《草房子》 |
第三人称 |
全知或有限视角 |
拓展视野,发展综合理解能力 |
《哈利·波特》系列 |
叙述 |
|
|
|