Wann Festplatten sterben
Artikel erschienen in Swiss IT Magazine 2007/04
Google betreibt eine der grössten Serverfarmen weltweit. Entsprechend gross ist die Datenbasis, die den Ingenieuren für ihre Studie «Failure Trends in a Large Disk Drive Population» zur Verfügung stand, in der sie herauszufinden versuchten, welche Faktoren die Lebensdauer einer Festplatte beeinflussen. Zu diesem Zweck haben sie die Leistungs- und Umgebungsdaten von über 100’000 Festplatten gesammelt und analysiert. Dabei handelt es sich ausnahmslos um sogenannte Consumer-Festplatten, die seit 2001 in Betrieb genommen wurden, mit PATA- oder SATA-Interfaces bestückt sind und Kapazitäten zwischen 80 und 400 GB bieten. Zudem wurden die Harddrives vor der Inbetriebnahme einem Stresstest ausgesetzt, der vergleichbar mit denjenigen von PC-Herstellern ist, um Herstellungsfehler auszusieben. Analysiert wurden Daten zwischen Dezember 2005 und August 2006.
Die Studie hat ergeben, dass die jährlichen Ausfallraten bei Festplatten zwischen 1,7 Prozent im ersten und 8,6 Prozent im dritten Betriebsjahr variieren, aber je nach Hersteller und Festplattenmodell schwanken. Der Einfluss der Aktivität auf die Lebensdauer ist vor allem innerhalb der ersten sechs Monate und im fünften Jahr gross. In dieser Zeit bedeutet eine höhere Belastung eine höhere Sterblichkeitsrate. Die Betriebstemperatur dagegen hat in den ersten drei Jahren kaum Auswirkungen auf die Langlebigkeit, nur scheinen Temperaturen unter 30 Grad etwas schlechter zu sein als ein Klima zwischen 30 und 40 Grad. Temperaturen über 40 Grad beginnen erst ab Jahr 3 den Laufwerken zu schaden.
Von den SMART-Daten einer Festplatte weisen nur wenige wie Scan-Fehler und Relocation Counts eine hohe Korrelation zu baldigen Festplattendefekten auf. Allerdings sterben 56 Prozent der Festplatten, ohne dass SMART auch nur einen dieser Fehler registriert hat. Zieht man alle SMART-Signale in Betracht, sterben 36 Prozent der Disks ohne Vorwarnung.