Amazon kämpfte Mitte April mit Problemen beim Cloud-Dienst EC2. Dabei gingen auch Kundendaten verloren (
Swiss IT Magazine berichtete). Nun hat
Amazon die Ursache für den Ausfall der Cloud-Server gefunden, wie es auf der
Webseite heisst. Schuld soll ein Routing-Fehler gewesen sein, der im Rahmen eines Netzwerk-Upgrades für den Cloud-Service Amazon Elastic Block Store (EBS) aufgetaucht sei. Dieser Dienst verfüge über zwei Netzwerke, wobei das zweite weniger Kapazität bietet als das erste. Der Netzwerkverkehr für das Update wurde beim Ausfall nicht auf den redudanten Router des ersten Netzes sondern auf das zweite Netz umgeleitet, welches nicht dafür ausgelegt ist. Dadurch wurde eine Kettenreaktion ausgelöst, die schlussendlich zum Datenverlust führte.
Indem Veränderungen genauer geprüft und automatisiert werden, sollen solche Ausfälle in Zukunft vermieden werden. Ausserdem soll der EBS-Service fehlertoleranter werden und mehr Kapazitäten erhalten, damit auch bei Ausfällen genügend Ressourcen vorhanden sind.
(abr)