Während sich die IT-Welt durch neue Technologien laufend verändert und einen immer grösseren Stellenwert im privaten und unternehmerischen Umfeld einnimmt, scheint eine Grösse konstant zu bleiben: das ständig wachsende Datenvolumen. Gemäss einer aktuellen Studie von IDC verdoppelt sich das weltweite Datenvolumen alle zwei Jahre. Dabei entstehen mehr als 75 Prozent des digitalen Universums durch einzelne Menschen. Die Unternehmen tragen jedoch für etwa 80 Prozent der Datenmenge die Verantwortung. Denn sie müssen dafür sorgen, dass die Informationen gespeichert, verwaltet und geschützt werden. Der grösste Teil dieses Datenwachstums wird durch sogenannte unstrukturierte Daten verursacht. Das sind Daten, die nicht in Form von beispielsweise Datenbankeinträgen als Ergebnis von IT-Systemen generiert werden, sondern in Form von Präsentationen, Dokumenten, Fotos, Filmen oder ähnlichem vorliegen. Diese unstrukturierten Daten entstehen in den Unternehmen meist nicht als Ergebnis eines eindeutigen Business-Prozesses und können – im Unterschied zu strukturierten Daten – nicht bereits bei der Entstehung klar klassifiziert werden. Ohne diese Klassifikation fehlt später die Entscheidungsgrundlage, welche Daten gelöscht werden können und welche nicht. Die Problematik ist seit langem bekannt, aber nur wenige Unternehmen haben für sich praktikable Mittel und Wege zur Lösung gefunden.
Heute steht man vor der Herausforderung, dass Daten nicht mehr gelöscht werden («data forever»), da kaum jemand qualifiziert über deren Notwendigkeit entscheiden kann. Vor diesem Hintergrund gewinnt die kosteneffiziente Speicherung von Daten zunehmend an Bedeutung. Im Folgenden werden Technologien und mögliche Anwendungsszenarien näher betrachtet, die Unternehmen helfen können, das Datenvolumen und die damit verbundenen Kosten trotzdem unter Kontrolle zu halten.
Cloud Storage als Ergänzung
Es befinden sich heute eine ganze Reihe von Anbietern am Markt, die sich auf die Bereitstellung von skalierbarem und kostengünstigem Speicherplatz über private oder öffentliche Netzwerke spezialisiert haben. Diese Cloud-Storage-Anbieter bieten den Speicherplatz als Service an und verrechnen diesen nach Verbrauch. Durch die grosse Anzahl Kunden und die dadurch entstehenden Synergien, aufgrund wesentlich höherer Automatisierung und Auslastung der Systeme, können Cloud-Storage-Anbieter heute hochverfügbaren und sicheren Speicherplatz zu günstigen Preisen anbieten.
Einige der globalen Cloud-Storage-Anbieter verfügen zudem über ein eigenes, weltweites Speichernetz, das die verschiedenen Knotenpunkte miteinander verbindet. Kunden können dieses bequem zur Synchronisation ihrer Daten zwischen den Knotenpunkten des Anbieters verwenden und so auch mit ihren ausländischen Niederlassungen Daten austauschen, ohne ihr eigenes Unternehmensnetzwerk überregional ausbauen zu müssen. Aufgrund der modularen Architektur und der umfassenden Netzanbindung kann Cloud Storage als Ergänzung zum klassischen, unternehmensintern installierten Speicher für Datenbanken und ähnliches gesehen werden – dies hauptsächlich für unstrukturierte Daten.
Mit neuer Technologie Cloud Storage im Unternehmen integrieren
Was aber nützt Cloud Storage, wenn der Kostenvorteil und die Flexibilität durch die Mehrkosten für die Netzwerkanbindung vom Unternehmensstandort zum Standort des Cloud-Storage-Anbieters wieder zunichte gemacht werden? Um dieses Problem zu adressieren, kommt heute primär die sogenannte Deduplication-Technologie zum Einsatz. Obwohl die Umsetzung der Technologie komplexe Software-Algorithmen erfordert, ist die Grundidee sehr einfach: Wir alle kennen die Situation, dass zum Beispiel während des Erarbeitungsprozesses eines Dokuments verschiedenen Versionen zwischengespeichert werden. Das gleiche Szenario gibt es, wenn man von einem einzelnen Motiv mehrere Fotos macht. Die verschiedenen Versionen des Dokuments oder die Fotos eines Motivs werden nun normalerweise alle als vollständige, einzelne Dateien gespeichert. Dies, obwohl zwischen den einzelnen Versionen und Fotos jeweils nur minimale Unterschiede bestehen. Dies führt dazu, dass auch grosse Teile der entsprechenden Daten mehrfach abgespeichert werden und entsprechend auch mehrfach an einen Cloud Storage übertragen werden müssten. Die Deduplication-Technologie analysiert nun diese Datenobjekte vor der Übertragung und merkt sich, welche Teile bereits bei vorangehenden Versionen übertragen und abgespeichert wurden. Es werden nur noch die Änderungen gegenüber der Vorversion des Dokuments oder des Bilds über das Netzwerk gesendet. Auf diese Weise werden beim Cloud Storage Provider dann die mehrfach vorhandenen Teile nur noch einmal gespeichert. Dies führt in der Praxis dazu, dass die übertragene und beim Cloud-Storage-Anbieter gespeicherte Datenmenge nach einer anfänglichen Lernphase um Faktoren reduziert wird.
Es gibt heute Appliances und Software-Komponenten von verschiedenen Herstellern am Markt, die auf der Basis der Deduplication-Technologie eine einfache Integration in das eigene Unternehmensnetzwerk erlauben. Oft vereinen diese Komponenten weitere Funktionen wie beispielsweise lokal in der Appliance installierte Storage-Kapazität als Cache oder Verschlüsselungskomponenten zur sicheren Übertragung und Speicherung der Daten.
Anwendungsszenario «Backup to the Cloud»
Ein Anwendungsszenario, welches durch die Kombination von Cloud Storage und der Deduplication-Technologie in Form von Hardware Appliances auch für KMU interessant wird, ist «Backup to the Cloud». In diesem Szenario wird das klassische Backup auf Tape, einer lokal am Server oder auf einer zentralen aber im eigenen Rechenzentrum installierten Backup-Infrastruktur, durch Cloud Storage ersetzt. Im eigenen Rechenzentrum wird dann anstelle des Bandroboters die Deduplication-Appliance installiert. Der lokal in der Appliance installierte Disk-Platz wird als Backup-Gerät direkt vom Backup-Server aus angesteuert. Die Appliance sorgt anschliessend im Hintergrund dafür, dass die Backup-Daten dedupliziert und verschlüsselt zum Cloud-Storage-Anbieter übertragen werden. Das aktuellste Backup wird dabei jeweils zusätzlich lokal auf der Appliance vorgehalten, so dass ein Restore – zum Beispiel zur Wiederherstellung eines Servers – in vielen Fällen ohne Netzzugriff auf den Cloud-Storage-Anbieter im eigenen Netz erfolgen kann.
Was ist bei der Wahl des Cloud-Storage-Anbieters zu beachten?
Grundsätzlich ist der Bezug von Speicherkapazität aus der Cloud vergleichbar mit jedem anderen Outsourcing von IT-Dienstleistungen. Es gelten dementsprechend für den Anwender auch dieselben Regeln. Im Zentrum steht das Anwendungsszenario, das gemeinsam mit dem Cloud-Storage-Anbieter implementiert werden soll. Ausgehend vom Anwendungsszenario kann meist auch festgelegt werden, welche Daten zum Cloud-Storage-Anbieter übertragen werden und welche Schutzbedürfnisse für diese Daten erfüllt werden müssen.Durch die Verfügbarkeit von Zugangstechnologien wie beispielsweise der vorgestellten Deduplication-Technologie in Form von einfach konfigurierbaren und betreibbaren Appliances, wird die Nutzung von Cloud Storage für grosse Datenmengen zur echten Alternative zur eigenen Storage-Installation im Rechenzentrum.
Christian Mugg ist Senior Product Manager Cloud Computing bei Swisscom.