2025年10月29日,微软Azure云服务发生大规模宕机事件,导致Microsoft 365、Xbox和Minecraft等多项服务无法正常运行。
微软发布的初步调查报告显示,此次宕机是由于Azure Front Door中的一次意外租户配置更改。该更改引入了无效或不一致的配置状态,导致大量AFD节点无法正常加载,进而引发下游服务的延迟增加、超时和连接错误。随着异常节点从全球节点池中掉线,健康节点间流量分配失衡,进一步放大了故障影响。
除了Microsoft 365、Xbox和Minecraft外,受影响的还包括Azure Active Directory B2C、Azure Communication Services等众多微软自家服务,几乎涵盖了微软云生态的大半边天。此外,依赖Azure的第三方企业服务也受到波及,如阿拉斯加航空和夏威夷航空的多项服务中断,加拿大魁北克的医疗机构Santé Québec部分病患访问系统暂停运行,星巴克、克罗格等网站也出现了服务中断高峰。
微软紧急阻止所有新的配置更改,以防止错误状态继续传播,并开始在全球范围内部署“最后一次已知正常”的配置版本。恢复过程采取了分阶段、渐进式策略,以确保系统稳定,并防止再次宕机。
经过近9个小时的处理,整体的错误率与延迟已恢复到事发前水平,但仍有少量客户存在尾部问题,微软在持续修复中。






