微软开源DeepSeek-R1魔改版：响应99%敏感提示，风险降50%

今天凌晨，微软在官网开源了DeepSeek-R1魔改版MAI-DS-R1，在保留原有推理性能的基础上进行了大幅度增强。尤其是在响应和屏蔽词方面有了显著改进：MAI-DS-R1可以响应99.3%的敏感话题提示，比原版R1提升了2倍，这对于政治学术研究、社会问题、伦理道德研究等帮助巨大；但在安全风险大幅度降低，比原版R1降低了50%。那些想体验一下“放飞自我”版R1的小伙伴们可以试试这个，非常有意思打开全新世界。

微软在训练 MAI-DS-R1 的过程中，从大约 350000 个被屏蔽的主题示例中，收集和筛选查询关键词，将这些关键词转化为多个问题，并翻译成不同语言；还通过 DeepSeek R1 和内部模型为这些问题生成答案和思维链。此外，训练数据中还纳入了来自Tulu3 SFT数据集的 110K 个安全和违规示例，这些示例涵盖了 CoCoNot、WildJailbreak 和 WildGuardMix 等内容。

随后，微软对MAI-DS-R1进行了综合评估。在敏感话题响应方面，MAI-DS-R1能够成功响应99.3%的敏感话题提示，这一表现显著优于DeepSeek R1和R1-1776。在安全性评估方面，MAI-DS-R1在HarmBench评估中表现出色，相比DeepSeek R1和R1-1776，在减少有害内容方面降低了50%风险。这说明虽然MAI-DS-R1能响应更多的敏感话题，但还是在安全控制范围之内。

在推理能力方面，MAI-DS-R1保持了与DeepSeek R1相同的推理能力，在一般知识、推理、数学和编程基准测试中表现非常出色。

在伦理和法律标准方面，MAI-DS-R1在处理非法或不道德的请求时表现得更加谨慎，拒绝生成有害或不当的内容。此外，MAI-DS-R1在后训练过程中将问题翻译成多种语言，能够更好地适应不同语言环境下的需求。这使得MAI-DS-R1在需要多语言支持的领域，如国际组织、跨国企业、教育机构等，能够提供多语言的高质量回答。目前，微软已经在huggingface开源了该模型，同时在Azure AI Foundry进行了发布。

微软开源DeepSeek-R1魔改版：响应99%敏感提示，风险降50%

紧张的柚子

引用和评论

【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶

🔥全程不用写代码，我用 AI 程序员写了一个飞机大战

从 DeepSeek 看25年前端的一个小趋势

Open WebUI：开源AI交互平台的全面解析

大模型中的Token究竟是什么？从原理到作用深度解析

OSPO Summit 2025 正式定档！议题征集同步开启

一文掌握 MCP 上下文协议：从理论到实践