Optische Zeichen- oder Texterkennung, auch bekannt als OCR (Optical Character Recognition), ist heute dem Gros der Information Worker ein Begriff. Fast alle namhaften Technologieanbieter von Google bis IBM bieten eine entsprechende Lösung an. Im Einsatz ist OCR überall dort, wo Dokumente ohne digitale Textinformation – in der Regel gescanntes Papier – digital interpretiert werden sollen. Etwa, wenn Bücher digitalisiert oder Verträge digital archiviert werden müssen. Die Vorteile liegen auf der Hand: Die Dokumente können nach dem Scan indexiert werden, sind fortan durchsuchbar oder werfen gar interessante Daten ab, die weiterverarbeitet werden können.
Im Falle eines klassischen KMU kann beispielsweise die Flut an Papierrechnungen und deren korrekte Archivierung durchaus ein paar Stellenprozent verschlucken. Und dabei ist die oben genannte Durchsuchbarkeit noch nicht einmal garantiert. In Zeiten von OCR kann man sich manuellen Aufwand damit sparen: Maschinen lesen die Inhalte von gescannten Dokumenten und leiten diese weiter, beispielsweise an Buchhaltungssysteme.
Neuere Daten-Extraktionslösungen punkten zusätzlich mit einem matchentscheidenden Zusatz-Feature: Informationen werden nicht nur ausgelesen, sie werden vom System auch interpretiert. So kann eine Künstliche Intelligenz (KI) etwa erkennen, ob es sich um eine Lieferantenadresse oder eine Rechnungsposition handelt und den Text entsprechend einordnen – ohne Vorarbeit oder vorgängiges Einrichten des Dokuments.
Mit einer E-Mail an die Adresse des eigenen Doxeo-Postfachs wird das einzulesende Dokument in das System eingepflegt und kann so mit Regeln im E-Mail-Client teilautomatisiert werden. (Quelle: SITM)
Sind die Dokumente einmal in Doxeo eingepflegt, können die Ergebnisse der Texterkennung nachträglich kontrolliert und falls nötig von Hand korrigiert werden. (Quelle: SITM)
Mit Werkzeugen zur Prozessautomatisierung liefert Doxeo Funktionalitäten über das reine Einlesen von Dokumenten hinaus, wie etwa mit konfigurierbaren Regeln für Dokumente. (Quelle: SITM)
Wenn das Dokument im Firmenpostfach angekommen ist, wird es von der KI und der OCR interpretiert und gelesen und steht kurze Zeit später zur weiteren Verwendung für den Benutzer bereit. (Quelle: SITM)
Der Claim
Letzteres Versprechen macht auch die Lösung Doxeo des Software-Entwicklers
Parashift aus Sissach im Kanton Basel-Land. Der Web-basierte Service arbeitet neben dem Einsatz von OCR mit einer hauseigenen KI, die Strukturen eines Dokumentes erkennen und interpretieren können soll.
Das System zielt dabei klar auf mittelständische Unternehmen ab. Parashift spricht von Firmen mit 50 bis 300 Mitarbeitern, die den Umstieg von Papier auf die digitale Verarbeitung von Dokumenten und deren Extraktion vollziehen wollen. Das heisst auch, dass die Lösung nicht als Zusatzfunktion in bestehenden Systemen gedacht ist, sondern, dass Benutzer direkt in der Doxeo-Anwendung arbeiten. Dabei, so der Hersteller, ist das längerfristige Ziel von Doxeo, den Preis für die Erfassung eines Dokuments unter einen Rappen pro Stück zu bringen. Damit sei Doxeo die günstigste Lösung für Rechnungseingangssysteme auf dem Markt. Im Praxistest von "Swiss IT Magazine" soll Doxeo zeigen, ob es die Versprechen halten kann.
Das Setup und die Usability
Doxeo ermöglicht die Einrichtung eines 14-Tage-Testabos der Lösung, in der alle Funktionen des Produktes zur Verfügung stehen. Einmal eingeloggt, wird der Anwender von einer freundlich ausschauenden und übersichtlichen Oberfläche begrüsst. Die Funktionen sind verständlich, die Navigation durch die Web-Applikation ist schnell und flüssig. In den Einstellungen findet sich ausserdem ein einfaches Berechtigungssystem, welches erlaubt, mit wenigen Klicks neue Benutzer einzuladen und deren gewünschten Berechtigungen zu konfigurieren. Beim Test wurde grösstenteils mit einem Admin-Account und vollen Berechtigungen gearbeitet. Während das Erstellen von neuen Benutzern und das Setzen deren Berechtigungen problemlos funktionierte, konnten im Test bestehende Berechtigungen nicht bearbeitet werden. Offenbar ein Bug – der hoffentlich rasch behoben wird.
Weiter gibt die Oberfläche Zugriff auf ein persönliches sowie auf ein firmenweites Postfach, wo die Dokumente eingeliefert werden, und bietet ein Archiv für abgearbeitete Dokumente. Auch eine einfache Funktion für geplante Tasks, die beliebigen Benutzern zugeordnet werden können, ist Teil der Lösung.
Die Texterkennung
Das Herzstück von Doxeo – die Datenextraktion aus Dateien mit reinen Bildinformationen – beginnt mit dem Import der Dokumente. Die einzige verfügbare Schnittstelle ist derzeit der Upload per E-Mail. Die Dokumente werden dabei als Anhang an eine spezielle E-Mail-Adresse gesendet und so in Doxeo importiert. Ein Bulk-Import ist nicht verfügbar, dem Feature-Voting-Forum ist aber zu entnehmen, dass diese Funktion bereits Teil der Roadmap ist. Der Vorteil am bestehenden E-Mail-Import ist aber, dass entsprechende Nachrichten automatisch an Doxeo weitergeleitet und Dokumente damit automatisiert importiert werden können.
Getestet wurde Doxeo mit fünf zufälligen Rechnungs-Layouts sowie einer Rechnung eines bekannten Lieferanten (Brack.ch). Der Import einer einseitigen, gescannten Rechnung nahm im Test einige Sekunden in Anspruch. Bis das Dokument vollständig eingelesen ist und weiterverwendet werden kann, wartet man insgesamt ein bis zwei Minuten.
Im Anschluss zeigten sich im Test aber erste ernsthafte Schwächen des Systems: Viele Dokumente werden zwar eingelesen und übersichtlich abgelegt, die Qualität der Extraktion lässt aber zu wünschen übrig. So wurden in einer Rechnung fünf von sechs Rechnungspositionen erfasst, die sechste fehlte. In einem anderen Beispiel konnte Doxeo die Lieferantenadresse nicht finden, obwohl diese offen ersichtlich und als Absender zu erkennen war.
Zu den ungenauen Extraktionsergebnissen gibt Parashift an, dass das System beim Einlesen von Beispielrechnungen mehr Probleme hat, als wenn Rechnungen von bekannten Lieferanten eingelesen werden. Doxeo könne in der Praxis einen Grossteil der importierten Kundendokumente gut interpretieren, so der Hersteller weiter. Der Test konnte dies grösstenteils bestätigen, die getestete Brack.ch-
Rechnung wies, abgesehen von einer kleinen Ungereimtheit bei den Rechnungspositionen, keine Fehler auf. Diese sogenannten Line Items seien für die meisten Kunden aber eher irrelevant und eine echte Herausforderung beim Training der KI, so der Hersteller weiter.
Das Problem bei den Fehlern im Extraktionsvorgang scheint die KI zu sein, welche die Felder der Rechnung fehlinterpretiert – sämtliche von der OCR gelesene Informationen waren inhaltlich korrekt, wie der Hersteller nach einer Analyse der Dokumente bestätigte. Die KI wird übrigens nicht anhand der Benutzereingaben trainiert, sondern nur durch Parashift selbst. Die Inputs der Nutzerschaft seien zu ungenau für ein korrektes Training, so der Hersteller.
Weiter verspricht
Parashift, ab September dieses Jahres die "Full Extraction" anzubieten und gänzlich auf rein automatisch generierte Ergebnisse zu verzichten. Alle Datenextraktionen sollten damit spätestens ab Herbst 100 Prozent akkurate Ergebnisse liefern. Es bleibt abzuwarten, wie schnell der Prozess dann noch ist, da neben maschinellen auch manuelle Korrekturen getätigt werden sollen, um die Ergebnisse zu perfektionieren. Die Qualität der Datenextraktion sollte mit dieser Änderung aber deutlich dazugewinnen.
Organisation und Prozesse
Grundsätzlich werden die freigegebenen Dokumente in Doxeo selbst archiviert. Wer die ausgelesenen Informationen ausserhalb, etwa in einer Buchhaltungssoftware oder einem ERP-System weiterverwenden will, braucht Schnittstellen. Diese sind derzeit noch nicht verfügbar, der Hersteller macht aber das Versprechen, dass man von Kunden gewünschte Schnittstellen zu den wichtigsten Systemen innerhalb weniger Tagen bereitstellen kann. In den nächsten Monaten würden die Standardschnittstellen zu den wichtigsten ERP-Systemen ausserdem standardmässig zur Verfügung gestellt werden, so
Parashift weiter.
Neben der Datenextraktion bietet Doxeo auch die Implementierung von einfachen Prozessen. Die Einlieferung von Dokumenten erfolgt zuerst immer direkt ins Firmenpostfach. Jeder Benutzer hat daneben ein eigenes Postfach, in dem alle Dokumente, welche ihm zugewiesen wurden, abgelegt sind. Dies geschieht entweder per manueller Zuteilung aus dem Firmenpostfach oder per Regel. Regeln können auch für verschiedenste Prozesse eingerichtet werden und reagieren auf eine Vielzahl von Bedingungen. Während das Feature in der Theorie sehr praktisch wäre, konnte es im Test leider nicht erfolgreich ausprobiert werden – das Erstellen einer neuen Regel brachte auf verschiedenen Rechnern und in verschiedenen Browsern das Web-Interface von Doxeo zum Absturz.
Ein weiteres Prozessinstrument in Doxeo ist die Dokumentenfreigabe. Hierbei werden einfache Prozesse eingerichtet, welche die Abnahme eines Dokumentes definieren. So wird eine Rechnung beispielsweise Mitarbeiter X zugeteilt, nach dessen Freigabe wird sie an die Mitarbeitenden Y und Z weitergeleitet, welche die Rechnung erneut freigeben müssen. Dies funktionierte im Test einwandfrei, es ist dabei aber nicht möglich, ein Dokument in Echtzeit zu verfolgen. Dies, weil die Benachrichtigungs-E-Mails sich nicht auf einzelne, sondern lediglich auf beliebige ausstehende Objekte im Postfach beziehen und nur alle 24 Stunden verschickt werden, was der Nachvollziehbarkeit des Prozesses nicht gerade zuträglich ist.
Preise und Vergleichbarkeit
Während Doxeo viele Arbeitsstunden sparen kann, ist die Investition nicht unbedeutend: Die vier verfügbaren Abos reichen vom Starter-Paket für 219 Franken pro Monat bis zur Enterprise-Version, die mit 1590 Franken pro Monat zu Buche schlägt. Die Angebote unterschieden sich durch die verfügbare Anzahl von Usern, Speicherplatz, Dokumenten, Regeln und Workflows. Die Vergleichbarkeit zur Konkurrenz ist dabei äusserst schwierig – die Genauigkeit der Ergebnisse und die daraus resultierende Handarbeit können variieren, was den tatsächlichen Wert der Lösung massiv verändert, ausserdem ist der grösste Teil der Konkurrenz nicht so transparent mit den Preisen wie
Parashift. Daher muss ein Unternehmen selbst sorgfältig abwägen, ob die Investition gerechtfertigt ist oder nicht. Hier kommen im Fall von Doxeo aber der Test-Account, den wir angesichts der beschriebenen Probleme wärmstens empfehlen, und die transparente monatliche Abrechnung zum Tragen, somit kann man die Lösung getrost testen, ohne viel Risiko auf sich zu nehmen. Einen genaueren Blick verdient Doxeo dann sicher nochmal im Laufe des Septembers, wenn die Lösung voll validierte Ergebnisse liefert. Ausserdem will Parashift noch diesen Herbst die Abos anpassen, um passendere Angebote offerieren zu können.
Eine fixfertige Lösung ist Doxeo, das übrigens erst in diesem Jahr lanciert wurde, in unseren Augen noch nicht. Zu ungenau ist das Lese-Ergebnis der KI, zu viele Kinderkrankheiten, kleine Bugs und Unklarheiten kommen hinzu. Ausserdem ist die Roadmap in diesem Moment noch ziemlich intransparent und lässt wenig Schlüsse darüber zu, welche Features priorisiert werden. Während das Produkt im Ansatz sehr gut aussieht und funktioniert, wird man das Gefühl nicht los, eine Beta zu bedienen. Angesichts der Preise darf man die Nutzung der Kundschaft als Testsubjekte im Allgemeinen durchaus in Frage stellen. Leider ein grassierender "Trend", den Parashift bei weitem nicht alleine zu verantworten hat.
(win)