Enterprise Search ist nicht wie Google
Artikel erschienen in Swiss IT Magazine 2008/10
Das Auffinden von Unternehmensinformationen ist vielerorts schlecht gelöst und die Zufriedenheit der Mitarbeiter dementsprechend auf inakzeptablem Niveau. Häufig wird die eingesetzte Suchmaschine respektive das gänzliche Fehlen einer zentralen Suchmöglichkeit als Grundübel identifiziert.
Doch wer nun glaubt, das Problem mit dem Einsatz einer günstigen Search-Appliance in den Griff zu bekommen, täuscht sich. In der Praxis muss der Hebel oft an ganz anderen Orten angesetzt werden. Die Suchansätze (Wonach suche ich?) sind dabei ebenso elementar wie die Erwartungshaltung (Ist das Ergebnis befriedigend?) oder die Qualität der Informationsarchitektur.
Die Ausgangslage ist schwierig. Die Benutzer haben sich über die letzten Jahre derart daran gewöhnt, dass Informationen im Unternehmen relativ schwer zugänglich sind, dass viele der Enterprise-Search-Thematik ablehnend gegenüberstehen. In der Tat sind die Arbeitsmethoden im Umgang mit Informationen seit langer Zeit praktisch unverändert geblieben. «Man» weiss, dass man Dokumente und Mails nur findet, wenn einem der Ablageort bekannt ist. Genauso weiss man auch, dass Informationen aus Datenbanken zwar gut strukturiert wären, aber ohne nötiges Fachwissen in der entsprechenden Anwendung genau so schlecht auffindbar und damit ebenfalls nicht mit der gebotenen Geschwindigkeit und Bequemlichkeit zugänglich sind.
Hinzu kommt eine zwar klare, aber zum Teil auf falschen Grundlagen beruhende Vorstellung der Benutzer, wie eine Enterprise-Search-Lösung auszusehen hat. Jeder kennt heute Google und wünscht sich für das eigene Unternehmen eigentlich nichts sehnlicher als eine genau so einfache Suchfunktion. Dabei ist es im Unternehmen aber enorm wichtig, unterschiedliche Suchansätze zu unterstützen. Benutzer wollen Suchresultate filtern und sich der gesuchten Information schrittweise annähern können, sie wollen den Fokus oder die Sichtweise unterwegs ändern, sie wollen von unterschiedlichen Geräten aus suchen, in unterschiedlichen Bereichen, wenn möglich sogar mehrsprachig, und sie wollen, dass die Enterprise-Search-Lösung ihnen bei der Suche hilft, zum Beispiel durch Gedächtnisbrücken oder eine komfortable Navigation.
Enterprise Search hat auch noch eine andere Seite: Die Lösung muss nämlich auch implementiert und betrieben werden. Im Gegensatz zu den Suchangeboten im Internet erledigt das nicht ein Provider, sondern die interne IT-Abteilung muss selbst in der Lage sein, die Lösung am Laufen zu halten, zu optimieren und zu supporten. Diese Aufgabe ist nicht auf die leichte Schulter zu nehmen, denn mit der besseren Zugänglichkeit zu Informationen steigt auch die Bedeutung der Zugriffssteuerung sprunghaft an. Falsch gesetzte Berechtigungen können verheerende Auswirkungen haben.
Performance-Ansprüche wollen ebenfalls erfüllt sein, und die Suche muss dem Benutzer als klar definierter Dienst angeboten werden können: Der Benutzer muss genau wissen, was er von der Suche erwarten kann.
Bevor man sich mit all diesen Herausforderungen auseinandersetzt, sollte aber grundsätzlich entschieden werden, in welchem Bereich Enterprise Search eingesetzt werden soll und welche Ziele damit verfolgt werden. Dazu lassen sich Search-Lösungen hinsichtlich Funktionalität und Integration in
vier Typen unterteilen:
- Basic Search: Suchlösungen mit einfacher Volltextsuche in einem eingeschränkten Bereich wie zum Beispiel die Windows Desktop Search oder die Google Search Appliance.
Es gilt also abzuklären, ob exakte Suchresultate erforderlich sind oder ob auch unvollständige (zu wenige) respektive irrelevante (zu viele) Suchresultate akzeptabel sind. In der Praxis zeigt sich, dass im Unternehmensumfeld exakte Suchresultate unabdingbar sind und mit heutigen Suchtechnologien keine befriedigenden Suchergebnisse erzielt werden können, wenn die Search-Lösung die Informationsarchitektur nicht berücksichtigt.
Rein volltextbasierte Search-Lösungen können allenfalls im Desktop-Search-Bereich nützlich sein, um persönliche Daten zu durchsuchen. Unternehmensweit bringen sie nicht viel. Sie sind unter Umständen sogar kontraproduktiv, weil die Benutzer Inhalte ausserhalb ihres eigenen Bereichs kaum so gut kennen, dass sie daraus brauchbare Suchbegriffe ableiten können.
Was im Internet funktioniert, geht also im Unternehmen nicht. Dafür gibt es mehrere Gründe:
- Informationen im Internet sind von Natur aus stark miteinander verlinkt. Dadurch ist es relativ einfach, Inhalte in einen Kontext zu bringen und relevante von irrelevanten Informationen zu trennen. Diese Vernetzung fehlt bei Unternehmensinhalten gänzlich.
- Aufgrund des Inhalts alleine kann keine verlässliche Aussage gemacht werden, in welchen Kontext eine Information passt.
- Inhalte im Unternehmen haben unterschiedlichste Formate, liegen auf einer Vielzahl verschiedener Ablagen und werden aus unterschiedlichen Motiven gesucht. Auch diese Faktoren erschweren die Bestimmung der Relevanz.
- Auch Internet-Suchmaschinen nutzen ausser dem Inhalt und den darin enthaltenen Links alle möglichen zusätzlichen Informationen (Metadaten), um die Relevanz von Suchresultaten zu bestimmen. Im Internet sind aber nicht die gleichen Informationen wichtig wie im Unternehmen.
Ein weiterer wichtiger Punkt, der vor der Einführung einer Enterprise-Search-Lösung unbedingt klargestellt werden sollte, ist die Bereitschaft des Unternehmens, Informationen einem breiten internen Kreis zur Verfügung zu stellen. Enterprise-Search-Lösungen stellen Suchresultate grundsätzlich «security-trimmed» dar: Informationen, auf die der Benutzer keinen Zugriff hat, werden gar nicht erst angezeigt. Das ist zwar richtig, hat aber zur Folge, dass in sehr restriktiven Umgebungen mangels Zugriffsberechtigung unter Umständen gar nichts gefunden werden kann. Extended-Search-Lösungen machen in einem solchen Umfeld keinen Sinn.
Konfigurationsparameter für Enterprise Search
Zusammenfassend lässt sich sagen, dass ausser den Suchansätzen und den Suchergebnissen insbesondere die Informationsarchitektur und die betrieblichen Aspekte für eine Enterprise-Search-Lösung ausschlaggebend sind. Um nun zu beurteilen, was die gewählte Lösung tatsächlich bringt, muss eine Gegenüberstellung dieser Aspekte gemacht werden. Während ein gutes Suchergebnis einen Mehrwert schafft, verursacht der Betrieb der Search-Infrastruktur Kosten. Es gilt also, die Betriebskosten zu minimieren und gleichzeitig die Qualität des Suchergebnisses zu maximieren, um einen möglichst hohen Nutzen zu erzielen.
Für den Betriebsaufwand ist die Wahl der Enterprise-Search-Lösung entscheidend. Produkte, die sich gut in die bestehende Infrastrukturplattform integrieren und als standardisierte Komponente unterhalten lassen, verursachen die geringsten Kosten im Betrieb.
Um das Suchergebnis zu optimieren, kann die Konfiguration der Search-Lösung bis zu einem gewissen Grad verbessert werden. Im Endeffekt muss aber der Informationsgehalt des Such-Index erhöht werden. Dies geschieht durch Anreicherung der Informationen mit zusätzlichen, beschreibenden Informationen (Metadaten), die unternehmensweit standardisiert sind und nach denen gezielt gesucht werden kann. Damit solche Metadaten die Suche unterstützen können, müssen die Informationen bereits im Entstehungsprozess mit business-relevanten Tags kategorisiert werden. Dies wiederum ist nur möglich, wenn die Informationsarchitektur der entsprechenden Ablagesysteme anwendungsspezifisch ausgelegt ist.
Konkret bedeutet dies, dass die Kategorisierung automatisch erfolgen muss, um sicherzustellen, dass die Informationen lückenlos und einheitlich getaggt sind. Entsprechende Lösungen müssen sowohl über Tagging-Mechanismen als auch über ein Metadaten-Management verfügen, in dem Metadaten global gehalten werden und auch die zeitliche Komponente zu berücksichtigen ist. Auch Metadaten können sich im Lauf der Zeit nämlich ändern.
Metadaten sind für die Suche so etwas wie die Adressen in einem Stadtplan. Der Vergleich lässt sich gut anstellen, denn sowohl Städte wie auch Informationssysteme wachsen organisch, auch in Systemen im Unternehmen gibt es verschiedene «Quartiere» mit unterschiedlichen «Kulturen», in denen man sich nicht so gut auskennt. Ohne Adresse findet man ein Gebäude in einer Stadt nur, wenn man weiss, wo es erbaut wurde. Genau so ist es mit Informationen: Über business-relevante Metadaten (zum Beispiel Kunde, Produkt, Projekt, Abteilung) lassen sich Informationen aber eindeutig und unabhängig von Ablagestrukturen identifizieren. Die Enterprise-Search-Lösung sollte dabei das Navigationssystem sein, das einem hilft, auf unterschiedlichen Wegen möglichst schnell und genau ans Ziel zu kommen.
Die Quintessenz ist also, dass ein Index allein noch keine gute Suche ermöglicht. Ausschlaggebend ist die Informationsarchitektur und dass die gewählte Enterprise-Search-Lösung diese mit einbeziehen kann. Nur so können unterschiedliche Suchansätze unterstützt und Suchergebnisse geliefert werden, die der Erwartungshaltung der Benutzer entsprechen.
Metadatenmodell und einheitliche Kategorisierung
Patrick Püntener ist Mitglied der Geschäftsleitung der itsystems AG, patrick.puentener@itsystems.ch