Analytics mit OpenOffice.org
Artikel erschienen in Swiss IT Magazine 2008/13
Die Beliebtheit von OpenOffice.org im privaten Bereich führt mittlerweile auch zu grossen Installationen. So setzen beispielsweise in Deutschland, Frankreich, Malaysia und den Niederlanden viele Behörden und Ministerien die kostenlose Software erfolgreich ein, was zunehmend auch den privaten Sektor ermutigt, auf OpenOffice.org oder Star Office umzusteigen. Da im professionellen Bereich Datenanalyse und Business Intelligence (BI) wichtige Themen sind, stellt sich natürlich die Frage, ob OpenOffice.org dafür überhaupt geeignet ist.
OpenOffice.org bietet zahlreiche Funktionen zur Analyse und Auswertung von Daten, angefangen bei der einfachen Diagrammkomponente bis hin zu komplexen Werkzeugen von Drittherstellern. Die Tabellenkalkulation von OpenOffice.org heisst Calc und ist bezüglich Bedienung und Funktionsumfang mit Microsoft Excel vergleichbar sowie in einem starken Masse auch mit Microsoft Excel kompatibel. Insbesondere das Diagramm-Modul Chart hat sich mit den letzten Versionen spürbar weiterentwickelt und unterstützt nun eine Vielzahl von Funktionen und Optionen. Die Anzeige von Regressionslinien und -formeln sowie die Verwendung von Fehlerbalken und mehreren
Y-Achsen sind kein Problem.
Dabei können die Bezeichner von Datenpunkten sehr variabel formatiert werden. Die DataPilot-Funktion in Calc macht die Auswertung von grossen Datenmengen in sogenannten Pivottabellen einfach und übersichtlich. Mit Hilfe von Pivottabellen können gleichartige Datensätze gruppiert, gefiltert
und sortiert werden, wodurch
der Anwender sich schnell einen Überblick über einen Sachverhalt verschaffen kann. Pivottabellen haben unter anderem grosse Bedeutung bei der Auswertung von Umsatzzahlen, wo man gern Umsätze nach Ländern, Kunden, Quartalen und Fiskaljahren sortieren und zusammenfassen möchte.
OpenOffice.org 3.0 führt ausserdem eine neue Funktion zur Teamarbeit ein. Mit Hilfe dieser neuen Funktion können mehrere Mitarbeiter gleichzeitig an einem Tabellendokument arbeiten, das in einem gemeinsamen Netzwerkverzeichnis liegt. Der (Haupt-)Autor der Datei gibt dafür die Datei für andere Mitarbeiter zur Editierung frei. Die Teammitglieder sehen dann beim Öffnen der Datei, wer die Datei eigentlich bearbeitet, und können dann Daten eingeben.
Der (Haupt-)Autor kann dann später die verschiedenen Eingaben und Änderungen einfach übernehmen oder auch ablehnen. In heterogenen Netzwerkumgebungen hat diese Lösung den Vorteil, dass ein Anwender angezeigt bekommt, welcher Benutzer konkret eine gemeinsame Datei gerade bearbeitet, anstatt nur eine Read-Only-Kopie des Dokumentes zu erhalten und nicht zu wissen, wer die Datei gerade blockiert. Ausserdem kann man mit der Funktion vermeiden, dass man umständlich viele Dateien manuell zu einer einzigen Datei zusammenführen muss.
Neben der Tabellenkalkulation Calc besitzen OpenOffice.org und Star Office auch eine Datenbankkomponente mit dem Namen Base. Mit Base können Datenbankanwendungen erstellt werden, die unterschiedliche Datenbankserver im Hintergrund verwenden. So können einerseits Anwendungen erstellt werden, bei denen sämtliche Informationen in einer einzigen Datei gespeichert werden, so dass ein in sich geschlossenes «Datenbankdokument» per Download oder per E-Mail verteilt werden kann.
Von Star Office gibt es neben der Desktop-Version auch noch eine Server-Variante. Der Star Office 8 Server ist für die Verwendung auf einem Server angepasst und optimiert worden und kann für die Konvertierung von Dokumenten ins PDF-Format genutzt werden. Die nächste Version der Server-Variante von Star Office wird ausserdem die Erstellung von Dokumenten per API sowie das Konvertieren von Dokumenten von beliebigen Formaten in beliebige Formate ermöglichen. Das zentrale Ausdrucken von Dokumenten wird ebenfalls möglich sein. Damit bietet sich der Star Office Server auch zur Produktion von Berichten auf dem Server an. Man kann auch OpenOffice.org per API serverseitig nutzen, jedoch bietet die kommerzielle Variante von Sun einige Optimierungen und Dienste, die eine Integration in existierende (Server-)Anwendungen vereinfachen.
Eine andere Möglichkeit, Dokumente auf dem Server zu erzeugen, ist die neue API. Damit lassen sich Dateien im ISO-Standard OpenDocument-Format (ODF) herstellen und beliebig manipulieren. Diese API, genannt ODFDOM, macht dies mit Hilfe von Java-Technologie möglich. Darüber hinaus gibt es auch zahlreiche ODF-APIs für andere Scriptsprachen wie Python, Perl und PHP, die vorwiegend von aktiven Mitgliedern der Open-Source-Gemeinde gepflegt und weiterentwickelt werden.
Neben den Funktionen, die OpenOffice.org beziehungsweise Star Office selbst bieten, gibt es ausserdem einige professionelle Lösungen von Drittherstellern. Insbesondere fallen hier PalOOCa, eine Erweiterung für OpenOffice.org für den Zugriff auf den Open Source OLAP-Server Palo, sowie das Star-Office-Add-in für Hyperion Essbase von Applied OLAP auf.
PalOOCa ist ein Add-on für OpenOffice.org Calc und wurde vor rund einem Jahr an der Technischen Universität Chemnitz entwickelt und unter LGPL-Lizenz veröffentlicht. Es ermöglicht sowohl den Lese- als auch den Schreibzugriff auf den freien OLAP-Server Palo (www.palo.net). Somit kann OpenOffice.org Calc durch PalOOCa beispielsweise für die Verteilung von Server-basierten Reports, die individuelle Gestaltung von Abfragen oder auch für die Datenerfassung genutzt werden.
Palo wurde für Geschäftskunden entwickelt und bietet als besonderes Feature ein Add-in für Microsoft Excel. PalOOCa stellt die vergleichbare Funktionalität unter Nutzung von OpenOffice.org Calc zur Verfügung. Damit wird die komplette Open-Source-Unterstützung für Business Intelligence auf Palo-Basis ermöglicht. Die Software liegt derzeit in Version 0.9 vor und wird in Kürze, nach Abschluss der Qualitätssicherung, in Version 1.0 veröffentlicht.
Das Star Office/OpenOffice-Add-in für Hyperion Essbase von Applied OLAP unterstützt und erweitert die Funktionalität von Hyperion Essbase 6.5, Essbase 7X und Hyperion System 9 Analytic Services. Die Erweiterung unterstützt die typischen Funktionen wie den Datenzugriff («retrieve»), das Aufbrechen und Zusammenfassen von Daten («drill», «zoom») und das Drehen beziehungsweise Vertauschen von Daten («pivot»). Das Add-in unterstützt ausserdem komplexere Funktionen wie Berechnungen und Kaskaden.
Einen Einblick in die neuen Funktionen von OpenOffice.org 3.0 inklusive der Verbesserungen in der Tabellenkalkulation und des Datenbankmoduls kann man durch die aktuell verfügbare Betaversion bekommen. Sie kann kostenlos von der OpenOffice-Webseite heruntergeladen werden. Die Extensions sind ebenfalls kostenfrei über das Extension Respository auf OpenOffice.org erhältlich.
Erwin Tenhumberg ist Senior Product Marketing Manager bei Sun und zuständig für OpenOffice.org und das OpenDocument-Format.