OpenXML versus Open Document

Mit Office 2007 und OpenOffice.org nutzen die wichtigsten Bürosuiten XML-Dateiformate. Doch was bringen sie den Anwendern?

Artikel erschienen in Swiss IT Magazine 2007/12

     

Bisher speicherte Anwendungssoftware ihre Daten als ein Abbild des Hauptspeichers auf Festplatten. Dieser Vorgang ist schnell und effizient, langwierige Übersetzungen der Datenstrukturen unterbleiben. Er ist aber auch fehleranfällig. Speicherabbilder enthalten Querverweise und Verkettungen. Ein fehlerhafter Wert beim Datentransfer führt zu unbrauchbaren Gesamtergebnissen.


Binärer Albtraum

Im Lauf der Jahre wurden die internen Datenstrukturen immer komplizierter. Anfänglich bestanden Dokumente nur aus Zeichenketten. Später kamen Textformatierungen, Schriftarten, eingelagerte Bilder und Tabellen hinzu. Mit steigender Komplexität stiegen der Platzbedarf auf Datenträgern und die Dauer, welche die Software zum Einlesen und Abspeichern benötigt. Mit jeder neuen Version entstanden Unverträglichkeiten mit den Daten der Vorgängerversionen. Die Datenübernahme anderer Hersteller wurde durch fehlende oder ungenügende Dokumentation der Dateiformate behindert. Besonders der Marktführer Microsoft verteidigte seine Position vehement, sowohl durch laufende Änderung der Dateiformate als auch durch ein Verbot von Rückübersetzungen. So entwickelten Alternativanbieter Import- und Exportfilter, welche allerdings nur rudimentären Dokumentenaustausch ermöglichen. Um das ursprüngliche Erscheinungsbild wiederherzustellen, sind aufwendige manuelle Nacharbeiten notwendig.


Wozu neue Dateiformate?

Längerfristig entstanden Probleme beim Zugriff, bei der Lesbarkeit, Nutzbarkeit und Vergleichbarkeit von Dokumenten. Besonders im Bereich öffentlicher Verwaltungen besteht Bedarf, auf alte und historische Dokumente uneingeschränkt zugreifen zu können. Über Jahrhunderte wurde Papier als Informationsspeicher erfolgreich genutzt. Ein Ersatz durch elektronische Datenverarbeitung kann nur dann erfolgen, wenn Nachhaltigkeit, Vertraulichkeit, Sicherheit und Datenintegrität gewährleistet werden. Parallel zum wachsenden Bedarf aus dem öffentlichen Sektor wuchs der Kostendruck in Unternehmen, hervorgerufen durch Unverträglichkeiten bei den verschiedenen Dateiformaten und daraus resultierender Ineffizienz der Arbeitsabläufe.
Mit herkömmlichen Dateiformaten sind derartige Anforderungen nicht abzudecken.


Langzeittauglichkeit gefordert

Führende Softwarefirmen entwickelten darauf im Rahmen des OASIS-Konsortiums einen offenen Dokumentenstandard, der die gravierendsten Probleme wie Langfristigkeit, Lesbarkeit und Fehlerresistenz lösen soll. Das Open Document Format (ODF) versprach ein Ende bisheriger Inkompatibilitäten zwischen Dateiformaten, sowohl versions- als auch herstellerübergreifend. Mit über 700 Seiten ist der Standard umfassend und für zukünftige Erweiterungen offen.
Öffentliche Verwaltungen und Institutionen erkannten das Potential des neuen Standards. Neben einigen Bundesstaaten der USA definierten vor allem Länder aus Südamerika und Europa sowie einige asiatische Länder ODF als verbindlichen Dokumentenstandard im Parteienverkehr und für interne Abläufe. Spätestens mit der Ankündigung des US-amerikanischen Department of Defence (DoD) im Jahr 2003, verstärkt Open Source Software und offene Dokumentenstandards zu nutzen, sah sich Microsoft gezwungen, auf diese Entwicklung zu reagieren.


Nicht nur Mittel zur Datenspeicherung

Microsoft verfügt über einen hohen Marktanteil im Bereich des Basisbetriebssystems, der Standard-Anwendungssoftware und auch bei den Dokumentenformaten. Insbesondere die Dokumentenformate helfen Microsoft, Update-Zyklen bei der Standardsoftware und den Betriebssystemen massgeblich zu steuern. Unverträglichkeiten zwischen den Versionen führen mittelfristig dazu, dass Firmen über ihre Aussenkontakte zu einem Update gezwungen sind, wenn sie nicht den Anschluss an ihre Partner verpassen wollen. Automatisierte Systemnachbesserungen erleichtern es Microsoft, diesen Zwang nach Belieben zu verstärken. Eine nachhaltige Neuorientierung grosser Kunden wie beispielsweise dem DoD gefährdet die Marktposition von Microsoft in ihren Grundfesten.
Diese Abkehr war nur durch die Bereitstellung offener Standards im Bereich der Dateiformate zu verhindern. ODF als Dateiformat kam und kommt aus marktpolitischen Überlegungen für Microsoft nicht in Frage. So wurde 2005 im Rahmen der ECMA ein neuer Standard ausgearbeitet: ECMA-376 oder Office OpenXML wurde am 7. Dezember 2006 trotz zahlreicher technischer Einsprüche durchgesetzt. Dieser Standard umfasst derzeit mehr als 6500 Seiten, zahlreiche XML-Schemaspezifikationen und deckt die Office-Anwendungen Word, Excel, Powerpoint und Access ab.


Was können die neuen Formate...

ODF und OpenXML sind sich auf technischer Ebene sehr ähnlich. Sie speichern verschiedene Bestandteile der Dokumente als XML-Dateien in ZIP-Archiven ab. XML-Dateien sind zwar grösser als binäre Dateiformate gleichen Inhalts, lassen sich aber aufgrund der hohen Informationsredundanz besser komprimieren. Die komprimierten Archive können schneller auf Datenträger geschrieben und von dort gelesen werden. Datei­inhalte werden nicht unmittelbar in den Arbeitsspeicher übernommen, sondern zuerst analysiert und in maschinenverwertbare Form umgewandelt. Dadurch sind die Dateiformate nicht nur fehlerresistenter als ihre Vorgänger, sondern können aufgrund ihrer offenen Struktur auch automatisiert nachbearbeitet werden.
ODF und OpenXML erlauben ergänzend die Einbindung binärer Informationsfragmente sowie Script- und Makrosprachen. Das führt allerdings zu neuen Sicherheitsrisiken. Keines der beiden Formate bietet hinreichenden integrierten Schutz vor ungewollten Änderungen von Daten­inhalten. Sie bieten genügend Angriffsfläche zum Einschleusen von Schadcode. Es bleibt den Anwendungsprogrammen überlassen, dies zu verhindern. Microsoft Office prüft anhand der Erweiterung des Dateinamens, ob der Aufruf von Makros erlaubt ist. Dieser Schutz ist allerdings leicht zu umgehen und suggeriert daher eine nicht vorhandene Sicherheit.
Beide Formate gewährleisten den längerfristigen Zugriff auf Daten. In der Darstellung hängen sie aber wie ihre traditionellen Vorgänger von zahlreichen externen Faktoren ab. Dies führt dazu, dass das optisch gleiche Erscheinungsbild mit den aktuellen Standards nicht über verschiedene Versionen desselben Programms hinweg und schon gar nicht zwischen unterschiedlichen Applikationen garantiert werden kann. Insofern bringen die neuen XML-Dateiformate den Anwendern optisch gesehen wenig.


...und wo unterscheiden sie sich?

Neben den Gemeinsamkeiten gibt es aber auch etliche Unterschiede zwischen ODF und OpenXML:

- ODF-Dateien sind kleiner als ihr OpenXML-Pendant.

- Während ODF Inhalte gemeinsam mit der Formatierung speichert, trennt OpenXML konsequent Text von der Formatierung. Das ist technisch sauberer und führt erstaunlicherweise nicht zu längeren Ladezeiten. Microsoft behält sich dabei allerdings die Option vor, grössere Dateien auch in einem proprietären Format einzubinden, um eventuelle Engpässe in der Performance zu umgehen. Hier sind Inkompatibilitäten vorprogrammiert.

- OpenXML greift nicht auf bestehende Standards zurück, während ODF auf eine Reihe von W3C-Standards (siehe Tabelle) setzt. Unter anderem wurden neue Standards für Grafiken, Texte, Tabellen, mathematische Formeln, Länder- und Farbcodes definiert. Damit wurde die Spezifikation aufgebläht. In der Umsetzung erhöht dies die Fehleranfälligkeit von Anwendungssoftware und Formatkonvertern.


Frei ist nicht gleich frei

Neben den technischen Aspekten geniessen auch die lizenzrechtlichen eine hohe Bedeutung, da sie mitentscheidend für die Zukunftsträchtigkeit eines Formats sind.
Sowohl ODF als auch OpenXML sind derzeit frei zugänglich, frei nutzbar, frei von Kosten sowie frei von patentrechtlichen Einschränkungen. ODF ist für Softwareentwickler wohl aber leichter zugänglich, denn der überschaubare Umfang der Spezifikationen erlaubt wirtschaftliches Einarbeiten in das Thema. OpenXML drängt sich mit über 6500 Seiten und zahlreichen Schemata dagegen dem Interessenten nicht unmittelbar auf. Zudem gilt es noch einige Punkte zu beachten:

- ODF kann im Gegensatz zu OpenXML im Rahmen der Lizenzen durch Dritte ergänzt werden.

- ODF kann auf 9 Referenzimplementierungen zählen, von denen einige im Quellcode verfügbar sind. Demgegenüber verweist Microsoft mit Office 2007 nur auf eine Referenzimplementierung, welche nicht quelloffen ist.


- Ein von OASIS in Auftrag gegebenes Gutachten bestätigt ODF patentrechtliche Unbedenklichkeit. Sun, Hauptzulieferer zum ODF-Standard, hat einen ergänzenden Forderungsverzicht abgegeben. Der Ausstieg einzelner Mitglieder aus dem OASIS-Konsortium ist klar geregelt, sodass in Zukunft Ansprüche von Altmitgliedern nicht zu erwarten sind. Eventuell zukünftig auftauchende Forderungen aus Patentrechten werden nicht vollständig ausgeschlossen. OASIS bestätigt dieses marginale Restrisiko, sieht aber selbst keinen Lösungsansatz.

Microsoft dagegen stellt die Nutzung von OpenXML jedermann frei. Microsoft verweist auf seine Patente im OpenXML-Standard, gibt allerdings auch einen schriftlichen Klageverzicht auf seiner Website ab. Dieser erschöpft sich auf die im Standard berührten Technologien und Patente. Patente, die von der ordnungsgemässen Umsetzung der OpenXML-Spezifikation in Anwendungssoftware berührt werden, sowie eventuelle Patente von Drittherstellern sind von dieser Freistellung nicht betroffen. Insbesondere bei der Einbindung in Anwendungssoftware sehen Rechtsexperten ein nicht unbeträchtliches Rechtsrisiko, welches Microsoft nicht entkräftet.


Gut für den öffentlichen Bereich!

Welches Format für welchen Einsatz geeignet ist, lässt sich aufgrund der unterschiedlichen Bedürfnisse nicht pauschal sagen. Öffentliche Verwaltungen und Regierungen fordern die Nutzung offener Dateiformate vor allem aus zwei Hauptgründen:

- Die langfristige Nutzbarkeit soll auf unterschiedlichsten EDV-Systemen gewährleistet sein. Diese Forderung wird hauptsächlich von Ämtern und Behörden gestellt.


- Die starke Abhängigkeit von Softwareanbietern soll reduziert und nach Möglichkeit lokales Know-how genutzt werden. Diese Forderung stellen vornehmlich Regierungen.

Hier hat ODF einen deutlichen Vorsprung. Das Format existiert bereits seit längerer Zeit, ist einige Male implementiert und in quell­offener Form zugänglich. Der Standard wird sowohl von grossen Softwareherstellern als auch von einer umfangreichen Entwicklergemeinschaft unterstützt. Allerdings ist die langfristige Erweiterbarkeit noch nicht nachgewiesen.
OpenXML kann auf keine substantiellen Vorteile verweisen, welche einen Einsatz zwingend notwendig machen würden. Allerdings besitzt Microsoft eine breit installierte Basis, auf die das Unternehmen starken Einfluss über seine automatisierten Updates ausüben kann.


Attraktiv für Unternehmen?

Bei Firmen spielen meist andere Faktoren eine Rolle. Dies, da Firmen meist in kurzfristigeren Innovationszyklen agieren. Dadurch hat nur ein geringer Teil der betriebsnotwendigen Informationen langfristige Relevanz (Verträge, Finanzinformationen) und muss entsprechend archiviert und gewartet werden. Der Rest der Arbeitsdokumente hat eine geringe Halbwertszeit.
Eine grundsätzliche Entscheidung bezüglich eines Dateiformates ist nur dann möglich, wenn die Entscheidung bezüglich alternativer Anwendungssoftware zur Disposition steht. Das Erstellen von ODF-Dateien mit Microsoft Office ist heute nicht möglich und zukünftig nicht absehbar. Umgekehrt ist das Erstellen von OpenXML-Dateien aus alternativer Anwendungssoftware derzeit nur eingeschränkt möglich. Da Microsofts Anwendungsprogramme in Unternehmen besonders stark verbreitet sind, ist der Einsatz von OpenXML zumindest dort naheliegend.
Bekannte Migrationsprojekte, wie jene der Stadt München oder der Lufthansa, sind weitgehend von strategischen, politischen oder ideellen Motiven geleitet. Wirtschaftliche Vorteile bei der Betrachtung der Gesamtkosten sind im Hinblick auf die Dateiformate allein marginal oder nicht vorhanden. Wer sich letztlich durchsetzen wird – öffentliche Verwaltungen und Regierungen, die ODF bevorzugen, oder Unternehmen, die Microsoft mit OpenXML nutzen –, ist derzeit nicht prognostizierbar.


Was können Konverter?

Prinzipiell bauen sowohl ODF als auch OpenXML auf XML-Schemata auf. Eine Umwandlung von einem Schema in ein anderes sollte prinzipiell keine grössere technische Hürde darstellen. Novell hat einen exemplarischen Konverter auf seiner Website bereitgestellt. Eine erweiterte und quelloffene Version ist auf SourceForge zu finden. Hier finden sich auch Testdokumente, anhand derer die Qualität der Konverter getestet und eventuell auftretende Mängel eingegrenzt werden können.
Die Praxis zeigt aber, dass die Umwandlung schnell an ihre Grenzen stösst. Die unterschiedlichen Schemaspezifikationen bieten Freiraum zur Interpretation durch die Anwendungsprogramme. Einige Schemaelemente sind nur in einem der beiden Standards vorhanden. OpenXML unterliegt hier konservativeren Einschränkungen. Eine korrekte Umwandlung kann nur erfolgen, wenn man den kleinsten gemeinsamen Funktionsumfang beider Dokumentenformate berücksichtigt. Darüber hinausgehende Funktionen der Anwendungssoftware dürfen nicht genutzt werden. Da dies weder den Anwendern zumutbar noch durchführbar ist, wird man bis auf weiteres mit Darstellungsunterschieden leben müssen.





Open Document Format und OpenXML im Quervergleich


Der Autor

Wolf Rogner ist selbständiger IT-Berater, Gerichtssachverständiger und Dozent. Sie erreichen Ihn unter www.rsb.at.




Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Was für Schuhe trug der gestiefelte Kater?
GOLD SPONSOREN
SPONSOREN & PARTNER