Daten für die Ewigkeit

Daten werden heute Gigabyte-weise gesichert, doch die Langzeitarchivierung dieser Backups ist bis anhin nur unbefriedigend gelöst.

Artikel erschienen in Swiss IT Magazine 2007/01

     

Das Sichern von laufend grösser werdenden Datenbergen ist unbestritten eine Herausforderung, für die es aber heute glücklicherweise verschiedene Wege und Hilfsmittel für praktisch jeden Anwendungszweck gibt. Doch Daten werden gesichert, damit später – unter Umständen auch viel später – wieder auf sie zugegriffen werden kann. Und hier können Probleme entstehen, die zum einen bei der eigentlichen Sicherung häufig ignoriert werden und für die es zum anderen noch keinen optimalen Lösungsansatz gibt.




Die Langzeitarchivierung von Daten ist nicht nur im Unternehmensumfeld durch gesetzliche Auflagen wie Sarbanes-Oxley ein äusserst wichtiges Thema. Auch im privaten Bereich muss man sich im Zuge der Digitalisierung die Frage stellen, ob man sich die auf einem Speicherchip festgehaltenen und später auf CD gebrannten ersten Schritte seines Sprösslings auch in 20 Jahren noch anschauen will und kann. Die Schwierigkeiten sind im Unternehmen wie im trauten Heim dieselben: Auf welchem Medium werden die Daten am besten gespeichert? Und vor allem, welches Medium kann in 20 Jahren – sei es Hardware- oder Softwaremässig – noch gelesen werden? Das beste Beispiel für diese Problematik ist das Floppy-Drive.






Will man heute wichtige Daten von einer alten 5½-Zoll-Disk auslesen, beginnen die Probleme bereits damit, irgendwo noch ein entsprechendes Laufwerk in einem funktionierenden Rechner zu finden. Je nachdem, in welchem Format die Daten gespeichert sind, kann man sich auch gleich auf die Suche nach dem entsprechenden Stück Software machen, um sie auszulesen. Papier kann in die Hand genommen und gelesen werden. Elektronische Daten hingegen benötigen elektronische Hilfsmittel.


Standardisierung keine Patentlösung

Immerhin ist man sich heute dieser Problematik bewusst und es gibt beispielsweise Bestrebungen in Richtung Standard-Formate. Bestes Beispiel ist hier das OpenDocument-Format (ODF), das vor etwas mehr als einem Monat vom Normgremium ISO offiziell als Standard mit der Bezeichnung ISO/IEC 26300 verabschiedet wurde. Diese Standardisierung hat vor allem Regierungsstellen bereits dazu bewogen, sich für ODF zu entscheiden: Dies, um künftig nicht von einem Hersteller abhängig zu sein und ausserdem jedermann (und nicht nur Besitzern von proprietärer Software) die Möglichkeit zu geben, auf öffentliche Schriftstücke zugreifen zu können. Nicht vergessen werden darf hierbei jedoch, dass auch Standards einen Lebenszyklus haben und kaum bis zum Ende der Menschheit bestehen bleiben.





Zudem ist durch standardisierte Formate wie ODF ein anderes Problem nicht gelöst. Letztlich geht es nicht allein darum, Files selbst wieder öffnen zu können. Es geht auch darum, ein bestimmtes File in den Datenbergen wiederzufinden. Dies ist im Prinzip mit Hilfe von Metadaten möglich, welche den Inhalt einer Datei beschreiben und es so erlauben, bestimmte Inhalte wiederzufinden. Verwaltet werden diese Metadaten von einer Datenbank. Sollte diese Datenbank nun aber eingestellt werden und so irgendwann nicht mehr nutzbar oder verfügbar sein, sind auch die von ihr verwalteten Daten faktisch verloren. Sie sind zwar noch als Archiv vorhanden, jedoch besteht dieses Archiv dann lediglich aus Datenmüll.








Auf welches Medium werden Daten in Ihrer Firma
langzeitarchiviert?


Richtiger Umgang mit optischen Disks

Die dritte Problematik bei der Langzeitarchivierung ist schliesslich das Speichermedium als solches. Nebst der angesprochenen Tatsache, dass bestimmte Speichermedien auch bestimmte Laufwerke und Software benötigen, welche nach Jahrzehnten eventuell schwer auffindbar sein können, sind die Medien selbst vergänglich. Das Unangenehme dabei: Niemand weiss heute genau, wie vergänglich sie sind. Dazu fehlen zum einen teilweise verlässliche Erfahrungswerte, zum anderen ist die Lebensdauer gewisser Medien von mehreren äusseren Faktoren abhängig.
Vieles hängt dabei von der richtigen Lagerung der Medien ab. Generell lässt sich sagen, dass Datenträger – egal welchen Typs sie sind – es gerne trocken und kühl mögen. Bei der Langzeitarchivierung ist die Rede von Temperaturen im Bereich von 10, 15 Grad Celsius und einer relativen Luftfeuchtigkeit von plus/minus 20 Prozent. Licht, vor allem direktes Sonnenlicht, ist nicht gewünscht.




Bei der CD beziehungsweise der DVD kommen noch weitere Punkte hinzu. Fingerabdrücke oder andere Verschmutzungen auf einer Disk können die Alterung wesentlich beschleunigen, da gewisse Kunststoffe, aus denen der Datenträger besteht, auf diese Verschmutzungen reagieren. Übrigens: Eine CD beziehungsweise DVD wird idealerweise mit einem fuselfreien Tuch und einer milden Seifenlauge oder Isoprophylalkohol von innen nach aussen gereinigt. Eine wesentliche Rolle soll Experten zufolge zudem auch die Qualität des Rohlings spielen. Im Wettlauf um möglichst günstige Datenträger haben die Hersteller offenbar beim Aufbau der Rohlinge gespart. Bei günstigeren Medien ist deshalb die Datenschicht deutlich empfindlicher. Für Backups lohnt es also, eine etwas teurere Kategorie Medien zu wählen. Zum Überprüfen des Zustands einer CD oder DVD kann beispielsweise das Tool DVDisaster (www.dvdisaster.de) zu Rate gezogen werden.






Dieses Tool zeigt an, ob ein Datenträger fehlerfrei arbeitet oder ob sich Lesefehler auf ihm finden. Zudem kann anhand einer Kurve abgelesen werden, wie viel Mühe ein Laufwerk mit dem Lesen des Mediums bekundet. Aufgrund der Werte dieser Kurve kann dann bestimmt werden, wann ein Datenträger sicherheitshalber kopiert werden sollte, bevor er eventuell nicht mehr gelesen werden kann.





Haltbarkeit von Medien


HDs, Flash und Tapes

Eher wenig geeignet ist die Harddisk als Medium für die Langzeitarchivierung. Festplatten sind mit elektronischen und mechanischen Komponenten bestückt, die altern und kaputtgehen können. Zudem sind Festplatten als magnetische Speicher (wie z.B. auch Disketten) anfällig auf Magnetismus. Nicht zuletzt stellt sich bei Harddisks nach einem gewissen Zeitraum die Problematik, dass sie sich infolge der technologischen Entwicklung eventuell nicht mehr anschliessen lassen. Im Moment wird beispielsweise IDE von SATA abgelöst, während man SCSI heute schon nur noch selten findet. Bei externen Festplatten geht man vom gleichen Problem aus, weiss doch heute niemand, ob USB oder FireWire in zehn Jahren noch aktuell sind. Und: Festplattenplatz ist eher teuer.






Das Preisargument gilt auch für Flash-Speicher, dem sonst aufgrund seiner Beschaffenheit (u.a. keine Mechanik) an sich eine relativ lange Lebensdauer prognostiziert wird. Zudem sind die Kapazitäten heute noch sehr begrenzt.
Im Unternehmensumfeld am gängigsten (siehe Grafik) sind heute ganz klar Tapes, die auf Magnetbändern basieren. Auch diese wollen richtig gelagert werden (kühl, geringe Luftfeuchtigkeit), zudem werden die Datenträger während des Lese- und Schreibvorgangs relativ stark belastet. Ausserdem werden die Medien linear angesteuert, das heisst, sie sind zwar für die Archivierung geeignet, nicht aber für den direkten Zugriff. Dafür bekommt man für relativ wenig Geld gigantische Mengen an Speicherplatz. Zudem gilt die Mechanik als robust, und es finden sich in den Medien selbst keine anfälligen elektronischen Bauteile. Und dadurch, dass die Bänder in einem Kassettengehäuse untergebracht sind, sind sie zu einem gewissen Masse vor Umwelteinflüssen geschützt.





Aufbewahrungsdauer von Dokumenten


Keine befriedigende Lösung

Die Situation heute ist also so, dass kein Speichermedium frei von Nachteilen ist und keines mit einer garantierten Lebensdauer von zig Jahren aufwarten kann. Dementsprechend gibt es für die Langzeitarchivierung bis anhin eigentlich auch keine befriedigende Lösung. Die Wahl für das Langzeitspeichermedium hängt von den Anforderungen an die Datensicherheit, den Lagerungsmöglichkeiten, der gewünschten Zugriffszeit und der angepeilten Dauer der Archivierungszeit ab. Doch unabhängig davon bleibt letztlich nicht viel anderes übrig, als die archivierten Daten von Zeit zu Zeit neu zu überspielen. Nur so kann sichergestellt werden, dass zum ersten das Medium seine Haltbarkeitsgrenze nicht überschreitet und zum zweiten Daten auf einem Speicher gesichert sind, der sowohl Hard- wie auch Softwaremässig noch ausgelesen werden kann.






Lagerbedingungen und ihr Einfluss

(mw)


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Fliegen erledigte das tapfere Schneiderlein auf einen Streich?
GOLD SPONSOREN
SPONSOREN & PARTNER