Am 21. Oktober berichtete Reuters, dass Amazon am Montag erklärt habe, dass seine Cloud-Computing-Einheit in seinem Rechenzentrum im Norden Virginias die Auswirkungen eines groß angelegten Netzwerkausfalls im Wesentlichen eingedämmt habe.Der Ausfall stürzte Tausende von Websites auf der ganzen Welt ins Chaos, darunter auch einige beliebte Apps wie Snapchat und Reddit.


Bildunterschrift: Das Amazon-Rechenzentrum ist ausgefallen

Amazon sagte, es habe die Ursache des Problems gefunden und stehe kurz davor, es vollständig zu lösen. Einige Benutzer berichten jedoch immer noch von Hindernissen bei der Nutzung von Diensten wie der digitalen Geldbörse Venmo und der Videokonferenz-Website Zoom. Von London bis Tokio zwang der Netzwerkausfall Büroangestellte dazu, offline zu gehen und Menschen sogar daran zu hindern, alltägliche Aufgaben zu erledigen, wie zum Beispiel einen Haarschnitt zu bezahlen oder Flugtickets zu ändern.

Es handelt sich um den weltweit größten Netzwerkausfall seit einem CrowdStrike-Systemausfall im vergangenen Jahr, der Technologiesysteme in Krankenhäusern, Banken und Flughäfen lahmlegte, was die Fragilität miteinander verbundener Technologiesysteme auf der ganzen Welt verdeutlicht. Der Vorfall ist mindestens das dritte Mal in den letzten fünf Jahren, dass ein groß angelegter Netzwerkausfall durch den Rechenzentrumscluster US-EAST-1 von Amazon Web Services (AWS) in Nord-Virginia verursacht wurde.

Amazon antwortete nicht auf weitere Anfragen, warum dieses bestimmte Rechenzentrum wiederholt betroffen war, sondern verwies stattdessen auf eine Online-Erklärung, in der es hieß, die Probleme seien „vollständig entschärft“ worden.

Der Ausfall ist auf das sogenannte Domain Name System (DNS) zurückzuführen. Nach Problemen mit dem System konnten verschiedene Anwendungen nicht die korrekte Adresse des AWS-Cloud-Datenbankdienstes DynamoDB API finden, einer Cloud-Datenbank zur Speicherung von Benutzerinformationen und anderen kritischen Daten.

Nach mehrstündigem Ausfall konnten viele Anwendungen am Nachmittag US-Ortszeit nach und nach den Betrieb wieder aufnehmen. Amazon AWS gab jedoch zu, dass immer noch ungewöhnlich hohe Fehlerraten viele Dienste beeinträchtigen.