Centra danych są zasadniczo dobrze chronione przed wszelką niepowołaną ingerencją, ale nie są one niezniszczalne. Do awarii usług przyczyniły się tym razem warunki atmosferyczne, przez co spora część usług w chmurze Azure pozostaje niedostępna w regionie południowo-centralnym w USA. Co dokładnie się wydarzyło?
Awarię spowodował piorun, który uderzył w system chłodzenia centrum danych w San Antonio. Na skutek tego wyładowania atmosferycznego nastąpił wzrost napięcia elektrycznego, który wpłynął na systemy chłodzące - wyjaśnia Microsoft. Włączyły się zautomatyzowane procedury centrum danych, które zapewniają integralność danych i sprzętu, a sprzęt o krytycznym znaczeniu wszedł w proces ustrukturyzowanego wyłączenia zasilania. Awaria objęła wiele usług i systemów, wliczając w to Office 365, Azure Active Directory i Visual Studio Team Services, jednak w dużym stopniu udało się już ją okiełznać.
Engineers have restored power to the datacenter and recovered a majority of network devices. Some services are starting to see signs of recovery, mitigation efforts continue. Updates: Portal - https://t.co/66mR6nPbwY Status Page - https://t.co/Dw19fIGsXf and/or Twitter. pic.twitter.com/dkmT24IVfr
— Azure Support (@AzureSupport) 4 września 2018
Dział wsparcia Azure poinformował, że inżynierom udało się przywrócić zasilanie centrum danych i przywrócić działanie większości urządzeń sieciowych. Można zauważyć oznaki odzyskania niektórych usług, niemniej jednak naprawy nadal trwają.
Stan platformy Azure można śledzić na specjalnej stronie, odświeżanej co kilka minut. W chwili publikacji tego tekstu dla praktycznie wszystkich usług w regionie "Południowo-środkowe stany USA" wyświetlane jest ostrzeżenie. Kolejne informacje o postępach prac nad odzyskiwaniem zostaną opublikowane na stronie jeszcze dziś.
Aktualizacja: o kulisach tej sprawy przeczytacie więcej tutaj.