cnt

Open-Source-OCR von Google

Texterkennung im Rohzustand, aber mit Zukunftsaussichten.
5. September 2006

     

Google hat die ursprünglich von HP entwickelte OCR-Engine Tesseract unter einer Apache-2.0-Lizenz in die Open-Source-Community entlassen. Im gegenwärtigen Zustand ist die Software eine reine Texterkennungs-Engine ohne Benutzeroberfläche, der überdies einige Funktionen fehlen. Google plant aber offenbar, das Projekt weiterzuentwickeln - darauf lässt eine Stellenanzeige schliessen, mit der Google Texterkennungsspezialisten sucht. In der aktuellen Version 1.0 lässt sich Tesseract von Sourceforge herunterladen. (ubi)


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Welche Farbe hatte Rotkäppchens Kappe?
GOLD SPONSOREN
SPONSOREN & PARTNER