Metadaten: der schlummernde Drache

Dank Metadaten werden Informationen schneller - oder überhaupt - gefunden. Künftig wird auch in Unternehmen kein Weg mehr an der Verschlagwortung vorbeiführen.

Artikel erschienen in Swiss IT Magazine 2007/22

     

Wenn Sie heute jemand fragen würde, was Sie unter Metadaten verstehen, was würden Sie ihm sagen? Nicht-repräsentative Umfragen zeigen, dass 80 bis 90 Prozent der in der Informatik Tätigen nicht einmal wissen, was Metadaten überhaupt sind. Deshalb möchte ich es Ihnen jetzt erklären. Und dies gleich vorneweg: Metadaten werden 2008 zu einem Trend, der nicht nur in allen Unternehmen, sondern auch im privaten Bereich Einzug halten wird. Bis sie schliesslich aus unserem Alltag nicht mehr wegzudenken sind. Da sollte man besser wissen, worum es geht. Natürlich ist das nur meine persönliche Einschätzung, aber urteilen Sie selbst.


Metadaten: Überall!

Veröffentlichen Sie Ihre Fotos bei Picasa oder Flickr? Dann benutzen Sie auch Metadaten, vielleicht ohne es zu wissen. Wenn Sie nämlich Ihre Fotos auf einer solchen Plattform ablegen und später wieder finden wollen, müssen Sie die Bilder mit Worten beschreiben. Zum Beispiel geben Sie für ein Bild von einem Alpenpanorama «Berg», «Alpen» oder «Panorama» als Stichwörter ein. Das ist nötig, weil die Bilder selber keine Information enthalten, nach der Sie suchen können. Diese Stichwörter sind Metadaten oder Informations-beschreibende Informationen, weil sie die Information, um die es eigentlich geht, mit weiteren, beschreibenden Informationen anreichern.



Im Internet und in Bildarchiven werden Metadaten schon seit Ewigkeiten verwendet. Oder auch in einer Bibliothek: Wenn Sie sich an die Karteikästen zurückerinnern, in denen Sie nach verschiedenen Themen, Autoren oder anderen Merkmalen Bücher gesucht haben, haben Sie schon damals Metadaten verwendet (nämlich eben besagte Themen oder Autoren), um über eine weitere Metainformation – nämlich den Standort des Buches – das gewünschte Buch im Regal zu finden. In diesem Fall ist der Grund, Metadaten zu verwenden, dass Sie sonst viel zu lange für die Suche brauchen würden. Sie müssten an allen Regalen vorbeilaufen und alle Buchtitel lesen. Und was, wenn Sie gar kein bestimmtes Buch suchten, sondern wissen wollten, welche Bücher zu einem Fachgebiet vorhanden sind? Sie würden die Bücher schlicht nicht finden, denn das Fachgebiet steht nur selten auf dem Buchrücken.




Somit dürften zwei Dinge klar geworden sein: Metadaten helfen, Informationen schneller oder überhaupt zu finden, und Metadaten verbinden an sich lose Informationen nach verschiedensten Kriterien. Eine Anwendung, welche die Nutzung von Metadaten bis zum Exzess treibt, ist übrigens www.spock.com, wo nach Informationen zu Personen gesucht werden kann. Spock sucht sich diese Informationen im ganzen Internet zusammen und verbindet sie über Metadaten, die vollautomatisch anhand der Inhalte vergeben werden.



Sie können diese Metadaten anklicken und gelangen so an ganz neue Informationen und Personen, die zu der ursprünglich gefundenen Person in einer Beziehung stehen. Das Interessante daran ist, dass nie jemand explizit diese Beziehungen definiert hat, sondern dass sie sich direkt aus den vorhandenen Informationen ergeben. So entsteht ein regelrechtes Metadaten-Modell, das nicht gepflegt werden muss, sondern sich aufgrund bekannter Informationen und deren Relationen selber verwaltet und erst noch die Metadaten automatisch auf die gesuchten Informationen schreibt.




Automatisierte Verschlagwortung


Metadaten im Unternehmen

Nichts spricht dagegen, das gleiche auch mit Informationen in Ihrem Unternehmen zu tun. Stellen Sie sich vor, alle Dokumente und
E-Mails würden automatisch nach mehreren Kriterien kategorisiert, ohne dass Sie etwas machen müssen. Dann könnten Sie endlich nach verschiedenen Sichten ordnen, nach Kunden oder Produkten filtern und Dokumente auf unterschiedlichsten Wegen finden, auch wenn Sie keine Ahnung haben, wo sie gespeichert sind. Starre Ordnerhierarchie ade! Und es gibt tatsächlich schon heute Lösungen, die so etwas in einem Unternehmensumfeld können.





Im Unternehmen ist es sogar noch einfacher als im Internet, die Metadaten zu verwalten. Denn die Kategorien, nach denen Sie Ihre Informationen einordnen wollen, sind bekannt und existieren zum grossen Teil schon im Unternehmen. Es sind die Kundennamen, Ansprechpartner, Mitarbeiter, Abteilungen, Standorte, Projekte, Produkte, Branchen, Firmengrössen, Regionen, Dokumentarten, Dossiers, Fälle und so weiter, nach denen Sie später suchen wollen. Und das sind alles Informationen, die Sie schon heute in einer Ihrer Geschäftsanwendungen führen. Mitarbeiter, Abteilungen und Standorte kommen aus Ihrem Directory oder aus Ihrer HR-Anwendung. Kunden, Branchen, Firmengrössen und Regionen aus Ihrem CRM. Und so weiter. Und zwischen den Metadaten bestehen bereits Relationen.



Zum Beispiel wissen Sie, welcher Mitarbeiter in welcher Abteilung arbeitet oder welches Projekt Sie mit welchem Kunden gemacht haben. Produkte wie MatchPoint oder iBox stellen ein Metadaten-Modell zur Verfügung, in das Sie diese Informationen inklusive Relationen einfach hineinsynchronisieren. In der Regel genügen 10 bis 12 Kategorien, um alle Informationen in einem Unternehmen ausreichend zu taggen (= mit Metadaten zu versehen), der Modellierungs-Aufwand hält sich somit in einem sehr bescheidenen Rahmen. Auch der Unterhalt eines solchen Modells ist günstig. Änderungen sind nur nötig, wenn sich etwas Grundlegendes an Ihrer Geschäftsstrategie oder in Ihren Prozessen ändert und Sie die Metadaten-Kategorien erweitern oder anpassen müssen.



Das Metadaten-Modell hilft Ihnen nicht nur, Daten aus mehreren System in einheitlicher Form als Metadaten verfügbar zu machen, sondern löst auch eine Reihe von Problemen, die Metadaten mit sich bringen. Ein solches Problem ist zum Beispiel die Dynamik, die in den Metadaten steckt. Kunden- und Produktnamen, Namen von Mitarbeitern und viele andere Begriffe, die Sie in Ihrem Modell verwenden, ändern sich – unter Umständen jeden Tag. Ein Kunde wird übernommen, ein Mitarbeiter ändert den Namen, schon haben Sie eine Änderung. Wenn Sie nun diese auf allen Dokumenten, die bereits getaggt sind, ständig nachführen müssten, kämen Sie schnell in Teufels Küche.



Das Modell weist jedem Begriff eine eindeutige Nummer (ID) zu und schreibt an Stelle des Begriffs diese ID auf das getaggte Dokument. Wenn der Begriff ändert, muss er lediglich im Modell auf der entsprechenden ID nachgeführt werden, und der neue Begriff ist über die gleiche ID wie vorher der alte mit allen getaggten Dokumenten verknüpft. Der sich ändernde Begriff an sich wird wie früher im führenden System (also zum Beispiel im ERP oder CRM) angepasst und automatisch ins Metadaten-Modell synchronisiert. Es fällt also überhaupt keine zusätzliche Arbeit an. An eine ID können auch mehrere Begriffe geknüpft werden, was eine History (d.h., der alte Begriff bleibt trotz Änderung erhalten und Dokumente werden auch unter dem alten Begriff gefunden), Synonyme und Mehrsprachigkeit im Modell ermöglicht.


History inbegriffen

Je nach verwendetem Produkt können die Metadaten aus dem eben beschriebenen Modell nun in unterschiedlichen Ablagesystemen verwendet werden, um Informationen zu taggen. MatchPoint unterstützt nur SharePoint 2007, während iBox auch File Shares, Exchange, Documentum, Interwoven und Hummingbird unterstützt. Nun stellt sich das nächste Problem: Wie gelangen die Metadaten auf Dokumente und E-Mails, ohne dass der Benutzer eingreifen muss?



Wer schon einmal ein DMS eingeführt und dort Metadaten verwendet hat, weiss um die Wichtigkeit dieses Aspekts. Als Benutzer sind Sie nämlich nicht im Geringsten daran interessiert, bei jedem Speichervorgang zehn Felder mit Metadaten zu befüllen. Dazu haben Sie weder Zeit noch Lust und manchmal auch nicht das nötige Wissen. Das Tagging sollte deshalb automatisch erfolgen. MatchPoint bietet dazu die Möglichkeit, beliebige Elemente in SharePoint 2007 zu taggen und die Metadaten auf die darin enthaltenen Informationen zu vererben.




Das heisst, Sie können Metadaten auf Sites, Listen, Libraries oder Ordner legen und die Dokumente dort einfach ablegen und die Metadaten werden über alle Hierarchiestufen hinweg vererbt. Oder Sie können Metadaten bereits auf einem Content Type vergeben, den Sie als Vorlage benutzen. Alle Dokumente, die mit diesem Content Type erstellt werden, enthalten dann bereits die entsprechenden Metadaten. Oder Sie können Begriffe, die Sie als Metadaten verwenden möchten, in die Dokumenteigenschaften schreiben, beim Speichern auslesen und in Metadaten umwandeln. Dies ist zum Beispiel beim Erfassen von Papierdokumenten interessant. iBox bietet darüber hinaus noch die Möglichkeit, Metadaten direkt aus dem Inhalt zu erzeugen.




Mit diesen Mechanismen und dank vorhandener Relationen im Modell gelingt es Ihnen in der Regel, zwischen 80 und 100 Prozent der benötigten Metadaten automatisch zu vergeben. Den Rest können Sie über einen grafischen Tagging Client manuell setzen. Im Gegensatz zu einem klassischen DMS ist diese Art der Vergabe komfortabel, schnell und intuitiv, weil Sie als Benutzer die Metadaten nur anklicken und nicht aus endlos langen Drop Downs aussuchen oder von Hand eingeben müssen. Im Endeffekt können Sie also Ihre Informationen mit minimalem Aufwand vollständig vertaggen.


Grosser Nutzen

Und der Nutzen? Der ist riesig! Sowohl MatchPoint als auch iBox stellen komfortable Suchoberflächen zur Verfügung, über die Sie Ihre Dokumente mit Hilfe der Metadaten sehr schnell und vor allem zuverlässig wieder finden. Sie müssen dazu weder Begriffe aus dem Inhalt noch den Ablageort kennen. Sie kombinieren lediglich verschiedene Begriffe aus den Metadaten und sehen sofort alle Dokumente, die entsprechend getaggt wurden. Unvollständige oder ausufernde Suchresultate, mit denen man nichts anfangen kann, sind damit Vergangenheit.


Neben der Suche gibt es aber eine beliebig lange Reihe weiterer Anwendungen, in denen Metadaten äusserst nützlich sind. Dazu gehören die automatische Erstellung von Berichten, elektronische Workflows, Informations-Analysen und Auswertungen, Informationsportale, Knowledge Management, Archivierung und vieles mehr. Im Prinzip ist jeder Vorgang, in dem eine Information eindeutig identifiziert werden muss, auf Metadaten angewiesen. Metadaten beeinflussen also nicht nur die Effizienz im täglichen Umgang mit Informationen, sondern spielen auch eine entscheidende Rolle in der Automatisierung und Überwachung von Prozessen und somit in der Qualitätskontrolle.



Ob Metadaten 2008 tatsächlich zum grossen Trend in der IT werden, hängt davon ab, wie kritisch die Produktivität und die Erfüllung von Qualitäts- und gesetzlichen Vorgaben für Unternehmen sein werden. Dass Metadaten einen grossen Nutzen bringen, ist aber unbestritten. Allein schon deshalb ist es interessant, sich mit ihnen zu befassen.




Einbindung von Informationen





Metadaten-Management-Tools


Der Autor

Patrick Püntener ist Mitglied der Geschäftsleitung der itsystems ag. (www.itsystems.ch)




Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Aus welcher Stadt stammten die Bremer Stadtmusikanten?
GOLD SPONSOREN
SPONSOREN & PARTNER