KI-Sprachmodell Dolly 2.0 frei verfügbar
Quelle: Databricks

KI-Sprachmodell Dolly 2.0 frei verfügbar

Mit Dolly 2.0 bringt Databricks ein KI-Sprachmodell mit 12 Milliarden Parametern in die Open-Source-Community, das frei auch für kommerzielle Anwendungen nutzbar ist und als Novum mit einem menschengemachten Trainings-Datensatz feingetunt wurde.
17. April 2023

     

Databricks, Anbieter einer Data-Lakehouse-Plattform, hat das KI-Sprachmodell Dolly 2.0 – die sprachliche Assoziation zu Dall-E 2 liegt nahe – zur freien wissenschaftlichen und kommerziellen Nutzung quelloffen publiziert. Dolly 2.0 ist ein Klon des Open-Source-KI-Modells Pythia-12B von der Organisation EleutherAI und ist von der Funktion her ähnlich ChatGPT für die Interaktion mit Menschen konzipiert. Im Gegensatz zum ChatGPT-Angebot von OpenAI lässt sich Dolly 2.0 ohne kostenpflichtigen API-Zugang auch für kommerzielle Anwendungen nutzen. Zudem würden keinerlei Nutzerdaten mit Dritten geteilt, versichern die Entwickler in einem Blogpost zur Veröffentlichung.


Allerdings zählt Dolly 2.0 mit 12 Milliarden Parametern nicht zu den grössten Large Language Models (LLMs). Die fortgeschrittensten LLMs arbeiten teils mit hunderten Milliarden Parametern – benötigen für den Betrieb aber auch deutlich mehr Ressourcen. Dolly 2.0 soll primär dazu dienen, dass Organisationen darauf aufbauend eigene LLMs bauen und spezifisch auf ihre Anwendungen zuschneiden können. Dazu haben haben über 5000 Mitarbeitende von Databricks an einem Trainings-Datensatz für die Feinabstimmung von Dolly 2.0 mitgewirkt, der 15'000 von Menschen trainierte Prompt-Antwort-Paare enthält, statt einen von einem anderen Modell abgeleiteten Datensatz zu verwenden – es handle sich um den ersten menschengemachten Datensatz für das Training von LLMs. Veröffentlicht wurde nun der Code des LLM, der Datensatz databricks-dolly-15k sowie die entsprechenden Gewichtungen unter der Cerative-Commons-Lizenz Attribution Sharealike 3.0. (ubi)


Weitere Artikel zum Thema

OpenAI lanciert GPT-4

15. März 2023 - OpenAI veröffentlicht sein neues Sprachmodell GPT-4, den Nachfolger von GPT-3.5, auf dem die aktuellen Version von ChatGPT basiert. Neu ist unter anderem, dass die KI nun Bilder interpretieren kann.

Elon Musk will nun auch eine ChatGPT-Konkurrenz entwickeln

28. Februar 2023 - Der Twitter-CEO Elon Musk rekrutiert mit Igor Babuschkin einen renommierten KI-Forscher. Das ambitionierte Ziel: Die Entwicklung einer ChatGPT-Konkurrenz.

Chatbot-Wettrennen: Meta kommt mit LLAmA

27. Februar 2023 - Meta hat ein eigenes Natural-Language-Processing-Modell namens LLaMA entwickelt, das als Basis für KI-Chatbots dienen und trotz geringerem Ressourcenverbrauch GPT-3 leistungsmässig überflügeln soll.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wie hiess im Märchen die Schwester von Hänsel?
GOLD SPONSOREN
SPONSOREN & PARTNER