Google hat ein neues, Tensorflow-basiertes Framework für Reinforcement Learning (RL) namens Dopamine
vorgestellt, das sowohl neuen als auch erfahrenen Nutzern mehr Flexibilität, Stabilität und Reproduzierbarkeit bieten soll. RL - ein Zweig des maschinellen Lernens, in dem Computerprogramme lernen, Massnahmen zu ergreifen, um ein bestimmtes Ergebnis oder eine bestimmte Belohnung zu maximieren – wird immer öfters angewendet. Bislang war es allerdings schwierig die damit erzielten Ergebnisse zu reproduzieren.
Das neue Paket von
Google soll nun einfache Bedienung, Tools, die die Wichtigkeit der Reproduzierbarkeit widerspiegeln, und eine Reihe von Trainingsdaten bieten, die es neuen Forschern ermöglichen sollen, ihre Ideen schnell mit etablierten Methoden zu vergleichen. Neben der Veröffentlichung des RL-Frameworks und der Trainingsdaten startet Google zudem eine
Website, die es Entwicklern ermöglicht, Trainingsläufe für mehrere Agenten zu visualisieren.
(swe)