Linkedin gibt eine Version der bisher intern genutzten Plattform Datahub als
Open Source frei, wie Kerem Sahin im Engineering-Blog von
Linkedin bekanntgibt. Bei Datahub, in einer früheren Version Wherehows genannt, handelt es sich um eine Search-, Discovery- und Editing-Plattform für Metadaten.
Entwickler können mit Datahub über eine modulare Schnittstelle mit Metadaten arbeiten. Im Hintergrund basiert die Plattform auf der Generalized Metadata Architecture GMA. Diese setzt auf verschiedene Speichertechniken und ein verteiltes Modell zur Verwaltung unterschiedlicher Metadatendienste.
Die nun freigegebene Open-Source-Variante ist allderings nicht mit dem Linkedin-intern genutzen Datahub identisch. So beherrscht der freie Datahub als Datenknostrukte nur Datasets und Users. Gewisse Linkedin-Metadaten wie Member Identifiers und Compliance-Angaben fehlen, es werden deutlich weniger Metadatenquellen unterstützt, und die interne Version arbeitet im Gegensatz zur Open-Source-Ausgabe mit mehreren Generalized Metadata Stores. Im oben verlinkten Blogbeitag findet sich eine Tabelle mit den unterschiedlichen Features.
(ubi)