据报道,北京时间5月3日凌晨3点43分开始,微软的Azure在全球范围内出现了大面积宕机,整个过程持续了将近2个小时,直到5点30分才完全恢复。受Azure宕机影响,包括Microsoft 365,Dynamics和DevOps在内的微软主要服务均出现使用问题。
现在微软官方发布声明,表示本次出现全球性宕机问题是由于“名称服务器授权”问题所导致的。微软解释道:“工程师确认是由于影响DNS解析的名称服务器授权调整影响底层root,并影响下游对计算,存储,应用服务,AAD和SQL数据库服务。在将旧DNS系统迁移到Azure DNS期间,Microsoft服务的某些域未正确更新。在此事件期间,没有客户DNS记录受到影响,并且整个事件期间Azure DNS的可用性保持在100%。该问题仅影响Microsoft服务的记录。”
根据公司的声明,尽管工程师在几个小时内确定并解决了该问题,但是一些访问具有错误配置的域的系统存储了该信息,从而导致更长的恢复时间,直到错误的缓存过期。也就是说,微软仍在调查这个问题,并承诺将在72小时内发布详细的根本原因分析(RCA)。