Freie Software für freie Dokumente
Artikel erschienen in Swiss IT Magazine 2006/04
Während freie Betriebssysteme, Datenbanken oder Content-Management-Systeme äusserst beliebt sind, fristen quelloffene Dokumenten-Management-Systeme (DMS) eher ein Mauerblümchendasein. Zu Unrecht, denn die Auswahl ist nicht nur gross, sondern auch die Anzahl verschiedener Bedürfnisse und Zielgruppen, welche die Lösungen
abdecken.
Die vorhandenen DMS kann man vor allem in zwei Gruppen aufteilen: Die webbasierten und die Client-Server-Systeme, die einen speziellen Desktop-Client erfordern. Die webbasierten Systeme sind dabei klar in der Überzahl. Ihre Vorteile liegen vor allem im problemlosen Zugriff von überall her und der relativ einfachen Installation und Wartung, da nicht auf sämtlichen Clients eine spezielle Software vorgehalten werden muss. Rich-Clients auf dem Desktop bringen den Anwendern dagegen meist mehr Komfort, da sie durch das umfassend gestaltbare User-Interface mehr Möglichkeiten bieten.
Die webbasierten DMS lassen sich dabei nochmals aufteilen, und zwar in eine Gruppe von Publikations- und Katalogsystemen für wissenschaftliche Institutionen sowie in Systeme für den Unternehmens- und Intranet-Einsatz.
Die Systeme für die wissenschaftlichen Institutionen sind Eigenentwicklungen von entsprechenden Einrichtungen wie Universitäten und besonders auf deren Bedürfnisse ausgerichtet. Dies merkt man nicht nur bei der Abbildung von Organisationsstrukturen, sondern auch bei der überraschend gut ausgeprägten Interoperabilität. In unserer Übersicht sind mit Fedora (Cornell University, University of Virginia), DSpace (Massachusetts Institute of Technology, Hewlett Packard), CDSware (CERN) und EPrints (Universtität von Southampton) gleich deren vier dabei. Ihnen ist allen gemein, dass sie das Metadaten-Schema Dublin Core sowie die Open Archives Initiative unterstützen.
DMS teilen sich mit den CMS nicht nur zwei Buchstaben, sondern auch die Vorteile, welche der Einsatz von Open Source mit sich bringt:
Anschaffungspreis: Im Vergleich zu den geschlossenen Systemen etablierter Anbieter, die meist vier- bis fünfstellige Summen für ihre Lösungen verlangen, kommen quelloffene Lösungen, die in der Regel kostenlos erhältlich sind, deutlich günstiger.
Offene Architektur: Sämtliche DMS greifen in irgendeiner Weise auch auf freie Software für Back-ends und andere Komponenten zurück. So setzt fast jedes auf den Datenbankserver MySQL oder den Apache Webserver. Dies hat nicht nur positive Auswirkungen auf den Anschaffungspreis, sondern auch auf die Plattformen, für welche die Applikationen verfügbar sind. So ist bei den webbasierenden Lösungen gleichzeitige Unterstützung für Windows, Linux und Unix auf Serverseite keine Seltenheit.
Grosse Flexibilität: Durch den offenen Code sind freie DMS in der Regel deutlich einfacher zu modifizieren und vor allem auch flexibler als die geschlossene Konkurrenz, bei der man sich nur in dem vom Hersteller vorgegebenen Rahmen bewegen kann. So kann die Software perfekt an die internen Abläufe und die Unternehmens-IT angepasst werden. Dies kann insbesondere in bezug auf Metadaten und Workflows von einem nicht zu unterschätzenden Wert sein.
Interoperabilität: Da etliche Systeme unter der Führung von Universitäten entwickelt werden, welche diese für die Publizierung, den Austausch und das Durchsuchen von Fachpublikationen benötigen, arbeiten die DMS sogar mit anderen Produkten zusammen und können Daten untereinander austauschen oder zu einem grossen Datenpool zusammengefasst werden. Dies kann vor allem für Unternehmen mit stark verteilten Standorten und einem grossen Dokumentenaufkommen äusserst interessant sein.
Diese Vorteile bringen auf der anderen Seite unter Umständen auch gewisse Risiken und Probleme mit sich.
Support: Wie auch bei anderer Open-Source-Software, die nicht von Firmen produziert und vertrieben wird, ist man beim Support entweder auf eine Community, eine eigene Entwicklungsabteilung oder auf einen externen Dienstleister angewiesen. Dies kann je nach Komplexität der Systeme und allfälliger Modifikationen zu einem erhöhten Implementierungsaufwand führen. Zudem muss man darauf achten, die Update-Pfade zu erhalten, um keine Forks zu produzieren. Sonst riskiert man, sich von allfälligen Weiterentwicklungen abzuschneiden.
Integration von proprietären Applikationen: Die Integration von proprietären Applikationen und Dokumenten-Formaten ist bei freien Lösungen prinzipbedingt (Lizenzen usw.) unterentwickelt, insbesondere, wenn die Formate respektive Schnittstellen nicht öffentlich dokumentiert sind. So ist vor allem auf diesen Aspekt bei der Evaluation zu achten.
«Insellösung»: Im Gegensatz zu etlichen proprietären DMS, die von den Herstellern im Komplettpaket mit Archivierungskomponenten und Speichermanagement angeboten werden, handelt es sich bei den offenen DMS meist um «Insellösungen», die sich aufs Dokumentenmanagement beschränken. Funktionen zur Archivierung oder zum Speichermanagement müssen dann, sofern sie benötigt werden, zusätzlich implementiert werden.
Wie bereits erwähnt, setzen vor allem die von Universitäten entwickelten DMS auf einheitliche Standards, die es ermöglichen, mehrere isolierte DMS zu Informationspools zusammenzufassen. Die wichtigste Rolle spielen dabei das Metadaten-Schema Dublin Core der Dublin Core Metadata Initiative sowie die Open Archives Initiative, kurz OAI.
Dublin Core definiert ein einheitliches Metadaten-Schema. Dies ist wichtig, damit Dokumente und Informationen zwischen verschiedenen Systemen ausgetauscht werden können, ohne dass erst aufwendige Umformungen durchgeführt werden müssen. Das Schema nimmt die wichtigsten Informationen in 15 Datenfeldern und 30 Unterfeldern auf, die alle optional sind und mehrfach definiert werden können. Dublin Core stellt eine Art kleinsten gemeinsamen Nenner unter den konkurrierenden Metadaten-Standards wie MARC (Machine-Readable Catalog, ein Austauschformat für bibliothekarische Daten) dar, sodass die Systeme neben Dublin Core oft auch noch andere Metadaten-Schemata unterstützten. Allerdings ist zu beachten, dass diese wie Eigenergänzungen unter Umständen nicht von jedem DMS unterstützt werden, das mit Dublin Core allein umgehen kann.
Für das Konsolidieren der Metadaten ist dann das OAI Protocol for Metadata Harvesting (OAI-PMH) zuständig. Es ist ein Austauschprotokoll, das auf HTTP und XML basiert und eine Abfrageschnittstelle für die Metadaten zur Verfügung stellt, womit mehrere Datenquellen zusammengefasst werden können.
Ausserhalb des universitären Umfelds spielen Dublin Core und insbesonder OAI-PMH dagegen eine kleinere Rolle. Dies liegt unter anderem an den unterschiedlichen Bedürfnissen der Zielgruppen. So haben sich die Entwickler der alternativen Systeme mehr an etablierten Industriestandards orientiert, die für die Integration der Systeme in die Unternehmens-IT von Bedeutung sind. Entsprechend unterstützen die restlichen Systeme fast alle Webservices via SOAP und verwenden wie jLibrary teilweise Speicherstandards wie JSR-170.
So lassen sich schon auf einer sehr tiefen Ebene verschiedene Applikationen miteinander vernetzen, was jLibrary besonders gut vormacht: Dank JSR-170 unterstützt jLibrary nicht nur Tools von Drittherstellern für den Zugriff auf das Archiv, sondern kann auch Daten von anderen JSR-170-kompatiblen Applikationen wie dem CMS Magnolia integrieren. Der Zugriff über WebDAV (Web-based Distributed Authoring and Version) und die Authentifizierung sowie das User-Management via LDAP oder Microsoft Active Directory werden ebenfalls von einigen DMS wie KnowledgeTree von Jam Warehouse Software unterstützt. Für dieses existiert mit dem Integrationsserver Baobab zudem eine interessante proprietäre Erweiterung. Denn Baobab stellt für KnowledgeTree nicht nur den WebDAV-Support zur Verfügung, sondern ermöglicht auch die Integration von KnowledgeTree in diverse Office-Suiten wie Microsoft Office und die automatische Archivierung von Dokumenten.
Freie Dokumenten-Management-Systeme im Überblick