G

Gazal R1 32B GRPO Preview

由 TachyHealth 开发
Gazal-R1-32B 是一款专为医学推理和临床决策打造的语言模型,基于 Qwen 3 32B 构建,在专业医学领域展现出卓越性能。
下载量 116
发布时间 : 5/26/2025

模型简介

Gazal-R1-32B 是一款专为医学推理和临床决策打造的语言模型,能为医学研究和临床支持提供有力帮助。

模型特点

医学专业知识
在 107,033 个合成医学推理示例上进行了专业训练,涵盖诊断推理、治疗规划、不确定情况下的决策和预后评估等方面。
透明推理
按照既定的临床推理框架,在 `<think></think>` 标签中提供带有逐步解释的结构化临床思维。
卓越性能
在 MedQA 上达到 87.1%,在 MMLU Pro(医学)上达到 81.6%,在 PubMedQA 上达到 79.6%,超越了大 12 倍的模型。
参数效率
采用了包括权重分解低秩自适应(DoRA)和秩稳定 LoRA(rsLoRA)在内的先进训练技术。
对齐优化
通过具有复杂多组件奖励系统的组相对策略优化(GRPO)进行了优化。
医学知识
对多个医学专业和临床场景有全面的理解。

模型能力

医学推理
临床决策支持
诊断推理
治疗规划
预后评估
医学知识问答

使用案例

研究和教育
医学教育和培训
用于医学教育和培训,帮助医学生和医生提升临床推理能力。
临床推理研究
用于临床推理研究,帮助研究人员分析复杂的医学案例。
专业支持
文献综述辅助
辅助医学文献综述,提供结构化的医学知识总结。
临床病例分析支持
支持临床病例分析,提供详细的诊断和治疗建议。
AIbase
智启未来,您的人工智能解决方案智库
简体中文