2025 年 7 月 14 日的 Cloudflare 1.1.1.1 事件

主要观点:2025 年 7 月 14 日 Cloudflare 因服务拓扑变更导致 1.1.1.1 边缘服务中断 62 分钟,影响使用 1.1.1.1 公共 DNS 解析器的客户及网关 DNS 服务间歇性降级,原因为维护向互联网通告 Cloudflare IP 地址的基础设施的遗留系统配置错误,全球范围内受影响,已采取措施恢复服务并总结经验教训以避免类似问题再次发生。
关键信息

  • 2025 年 7 月 14 日 21:52 UTC 至 22:54 UTC 1.1.1.1 解析器服务不可用,全球大部分用户受影响,互联网服务基本不可用,可在Cloudflare Radar观察到。
  • 6 月 6 日为未来 DLS 服务准备服务拓扑的发布中引入配置错误,将 1.1.1.1 解析器服务的前缀与新 DLS 服务的前缀意外包含在一起,故障前处于休眠状态未影响终端用户。
  • 7 月 14 日 21:48 为同一 DLS 服务进行配置更改,触发全球网络配置刷新,导致 1.1.1.1 解析器的 IP 地址被意外包含,前缀开始从全球生产 Cloudflare 数据中心撤回。
  • 技术方面,Cloudflare 管理服务拓扑的方式存在问题,旧的硬编码数据中心位置列表方式易出错,新方式虽更好但仍需同步数据,此次故障暴露了配置错误及 BGP 劫持问题(但并非故障原因),通过恢复先前配置并加速修复进程使服务恢复正常。
    重要细节
  • 影响的 IP 地址范围包括 1.1.1.0/24 等多个地址,不同协议的查询率在故障期间有明显变化,DoH 流量相对稳定,DoT 流量大幅下降。
  • 为避免类似问题,Cloudflare 将弃用旧的部署方法,加速弃用遗留系统,提高文档和测试覆盖率。
  • Cloudflare 提供多种网络服务,用户可访问1.1.1.1使用免费应用,了解更多可访问www.cloudflare.com,查看开放职位可访问www.cloudflare.com/careers
阅读 288
0 条评论