G

GLM Z1 Rumination 32B 0414

由 THUDM 开发
GLM-Z1-Rumination-32B-0414是一款具备反刍能力的深度推理模型,基于320亿参数的GLM-4-32B-0414开发,专注于解决开放和复杂问题。
下载量 1,359
发布时间 : 4/13/2025
模型介绍
内容详情
替代品

模型简介

该模型通过长时间的深度思考和整合搜索工具处理复杂任务,特别擅长研究式写作和复杂检索任务。

模型特点

深度思考能力
通过冷启动和扩展强化学习训练,显著提升数学能力和复杂任务解决能力。
反刍能力
通过更长时间的深度思考解决开放和复杂问题,整合搜索工具处理复杂任务。
多规则奖励引导
利用多规则奖励引导和扩展端到端强化学习进行训练,提升模型性能。

模型能力

文本生成
数学推理
复杂任务解决
研究式写作
复杂检索
函数调用

使用案例

学术研究
城市AI发展对比分析
撰写两座城市AI发展对比分析及其未来发展计划。
在研究式写作和复杂检索任务上表现出显著提升。
工程代码
代码生成
生成工程代码和函数调用。
在工程代码和函数调用方面表现良好。