OpenAI, bekannt für den in Microsofts Software verwendeten KI-Chatbot ChatGPT, hat die
OpenAI Data Partnerschaft lanciert und ruft damit Unternehmen auf, öffentliche und private Datenbestände für das Training von KI-Sprachmodellen beizusteuern.
Wie das Unternehmen via Blog-Post
mitteilt, ist man primär an grossen Datensätzen interessiert, welche die menschliche Gesellschaft abbilden und die noch kaum veröffentlicht wurden. Weiter heisst es, man sei an Texten, Bildern, Audio- und Videomaterial interessiert, die Absichten zum Ausdruck bringen, also eher Texte über längere Gespräche als viele unzusammenhängende Bruchstücke. Weiter heisst es, zur Digitalisierung von Texten würde eine hochkarätige OCR-Technologie wie auch eine automatische Spracherkennung für die Transkribierung von Audio-Material zur Verfügung stehen.
Aktuell bietet OpenAI zwei Arten von Partnerschaften: Partner, die bei der Erstellung eines Open-Source-Datensatzes helfen, der öffentlich wäre und von jedermann für das Training von KI-Modellen genutzt werden könnte. Andererseits ist man aber auch an Unternehmen interessiert, die private Datensätze für das Training eigener KI-Modelle zur Verfügung stellen.
Unternehmen, die OpenAI ihre Daten zur Verfügung stellen möchten, können sich über ein Online-Formular
anmelden. In der Mitteilung finden sich keine Hinweise darauf, ob OpenAI auch dazu bereit ist, für die Bereitstellung der Datensätze zu bezahlen.
(rd)