M

MAI DS R1

由 microsoft 开发
MAI-DS-R1是微软AI团队对DeepSeek-R1推理模型进行后训练的成果,旨在提升其对敏感话题的响应能力并优化风险表现,同时保持原有推理能力和竞争优势。
下载量 8,840
发布时间 : 4/16/2025
模型介绍
内容详情
替代品

模型简介

基于DeepSeek-R1推理模型的后训练版本,由微软AI团队开发,用于填补先前模型的信息空白并改善其风险表现,同时保留R1的推理能力。

模型特点

增强的敏感话题响应能力
通过后训练解除了原始R1模型对大多数查询的限制,优化了对敏感话题的响应能力
优化的风险表现
在相关安全基准测试中优于Perplexity近期发布的R1-1776模型,同时保留了原始DeepSeek-R1的通用推理能力
多语言支持
使用了约35万条内部开发的多语言示例数据集进行后训练
保留原始推理能力
在提升安全性的同时,保持了DeepSeek-R1原有的强思维链推理和通用语言理解能力

模型能力

通用文本生成与理解
通用知识任务
推理与问题解决
代码生成与理解
科学与学术应用

使用案例

文本生成
对话生成
生成连贯、上下文相关的对话内容
文章写作
根据提示生成结构完整的文章
故事续写
基于给定开头续写故事
知识问答
开放领域问答
回答需要事实性知识的开放领域问题
推理与问题解决
数学应用题
解决多步数学推理问题
采用思维链策略提高准确性
逻辑谜题
解决复杂逻辑问题
编程辅助
代码生成
通过生成代码片段协助编程任务
代码解释
解释代码功能和逻辑
学术研究
STEM问题解决
辅助科学、技术、工程和数学领域的结构化问题解决