Google Deepmind hat zwei neue Gemini-Modelle für den Robotik-Bereich vorgestellt. Ersteres heisst Gemini Robotics und kann die Aktionen eines Roboters unter Einbezug von KI steuern. Einerseits befähigt das Modell damit ausgestattete Roboter, Sprachbefehle dank einer verbesserten Verständlichkeit präziser umzusetzen. Ausserdem sollen durch die KI auch mechanische Bewegungsabläufe ermöglicht werden, die dem Roboter nicht explizit einprogrammiert worden sind. Dazu wertet Gemini die Bilder der Roboterkamera aus. Dies soll den Roboter obendrein auch befähigen, seine Umwelt besser zu überwachen und seine Aktionen daran auszurichten.
Als zweites Modell wurde Gemini Robotics-ER präsentiert, wobei ER für Embodied Reasoning steht. Dieses Modell ermöglicht quasi das räumliche Denken für Roboter: Die Geräte sind in der Lage, Objekte und die Distanz dazu erkennen und obendrein auch, wie sie am besten sicher transportiert werden. Als Beispiel nennt
Google etwa eine Kaffeetasse mit Henkel. Mit Gemini-ER ausgestattete Roboter seien dann intuitiv in der Lage, die Tasse sorgfältig am Henkel festzuhalten und sie entsprechend vorsichtig auch wieder abzulegen.
Google wird die KI-Modelle den Robotik-Unternehmen Apptronik, Agile Robots, Agility Robots, Boston Dynamics und Enchanted Tools zum Testen zur Verfügung stellen. Der Tech-Riese schreibt abschliessend, das die KI auch dazu eingesetzt werden kann, um die Sicherheit im Umgang mit Robotern zu verbessern. Die Modelle seien darauf trainiert, dass durch keine Handlung des Roboters ein Mensch oder der Roboter selber gefährdet werden darf.
(dok)