Forscher der University of Texas in Dallas haben ein neues System entwickelt, das Robotern ermöglicht, Objekte besser zu identifizieren und sich daran zu erinnern. Das System ermöglicht es dem Roboter, Objekte mehrmals zu drücken und dabei eine Bildersequenz zu sammeln, die ihm hilft, die Objekte zu erkennen und zu segmentieren. Im Gegensatz zu früheren Ansätzen, die auf einem einzelnen Druck oder Griff beruhten, stellt dies einen bedeutenden Fortschritt dar. Die Forscher stellten ihre Ergebnisse auf der Robotics: Science and Systems Conference in Südkorea vor. Das robotische System verwendet künstliche Intelligenz (KI), um eine Vielzahl von Objekten in verschiedenen Umgebungen, wie z.B. Haushalten, zu erkennen. Das System kann auch ähnliche Versionen von gängigen Gegenständen mit Variationen in Marken, Formen oder Größen identifizieren. Die Forscher trainierten ihren Laborroboter, genannt Ramp, mit Spielzeugverpackungen von gängigen Lebensmitteln. Ramp, ein Fetch Robotics Mobilmanipulator-Roboter, verfügt über einen mechanischen Arm mit sieben Gelenken und eine quadratische Hand mit zwei Fingern zum Greifen von Objekten. Die Forscher drückten jeden Gegenstand 15 bis 20 Mal, um dem Roboter zu ermöglichen, detailliertere Fotos mit seiner RGB-D-Kamera aufzunehmen und potenzielle Fehler zu reduzieren. Diese Methode nutzt langfristige Interaktion des Roboters, um die Objektsegmentierung zu verbessern. Das Team plant, andere Roboterfunktionen wie Planung und Steuerung zu verbessern, um komplexere Aufgaben zu ermöglichen. Die Forschung wurde von der Defense Advanced Research Projects Agency (DARPA) unterstützt.
Einführung
Ein Team von Informatikern an der University of Texas in Dallas hat ein neues System entwickelt, das Robotern hilft, Objekte besser zu erkennen und sich daran zu erinnern. Dieses System verwendet künstliche Intelligenz (KI) und ermöglicht es dem Roboter, eine Sequenz von Bildern zu sammeln, indem er Objekte mehrmals drückt. Dadurch wird die Objekterkennung und Segmentierung verbessert. Die Forscher stellten ihre Ergebnisse auf der Robotics: Science and Systems Conference in Südkorea vor.
Herausforderungen bei der Objekterkennung für Roboter
Bisherige Ansätze zur Objekterkennung für Roboter basierten auf einem einzelnen Druck oder Griff, um Objekte zu lernen. Diese Methoden hatten jedoch Einschränkungen bei der genauen Erkennung und Segmentierung von Objekten. Die Erkennung von Objekten mit Variationen in Marken, Formen oder Größen und in verschiedenen Umgebungen stellte zusätzliche Herausforderungen dar.
Einschränkungen bisheriger Ansätze
Bisherige Ansätze zur Objekterkennung von Robotern hatten folgende Einschränkungen:
- Genaue Identifizierung und Segmentierung verschiedener Objekte
- Erkennung von Variationen in Marken, Formen oder Größen gängiger Gegenstände
- Lernen von Objekten in verschiedenen Umgebungen
Das neue System für verbesserte Objekterkennung
Das von dem Team an der University of Texas in Dallas entwickelte System adressiert die Einschränkungen bisheriger Ansätze zur Objekterkennung. Es ermöglicht Robotern, Objekte mehrmals zu drücken, um eine Sequenz von Bildern zu erfassen, die die Objekterkennung und Segmentierung verbessern.
Einsatz von künstlicher Intelligenz
Das neue System nutzt künstliche Intelligenz (KI), um eine Vielzahl von Objekten in verschiedenen Umgebungen wie Wohnungen zu erkennen. Dadurch kann sich der Roboter besser an seine Umgebung anpassen und Objekte genau erkennen.
Erfassung einer Sequenz von Bildern
Der Roboter, namens Ramp, wird mit Spielzeugverpackungen von gängigen Lebensmitteln trainiert. Die Forscher haben jedes Objekt 15 bis 20 Mal gedrückt, um Ramp zu ermöglichen, detailliertere Fotos mit seiner RGB-D-Kamera aufzunehmen. Diese Sammlung von Bildern hilft, die Objekterkennung zu verbessern und potenzielle Fehler zu reduzieren.
Verbesserung der Objektsegmentierung
Die Methode des mehrmaligen Drückens von Objekten nutzt die langfristige Interaktion mit dem Roboter zur Verbesserung der Objektsegmentierung. Dadurch kann der Roboter einzelne Objekte von ihrer Umgebung besser unterscheiden und identifizieren.
Vorteile und Anwendungen
Die Verbesserungen in der Objekterkennung und -segmentierung haben verschiedene Vorteile und Anwendungen, darunter:
- Verbesserte Effizienz des Roboters bei verschiedenen Aufgaben
- Bessere Anpassungsfähigkeit des Roboters an verschiedene Umgebungen
- Verbesserte Interaktion zwischen Robotern und Menschen
Zukünftige Entwicklungen
Die Forscher wollen sich nicht nur auf die Verbesserung der Objekterkennung und -segmentierung beschränken. Sie planen auch, andere Funktionen des Roboters, einschließlich Planung und Steuerung, zu verbessern, um den Robotern die Durchführung komplexerer Aufgaben zu ermöglichen. Diese Fortschritte in der Robotik haben das Potenzial für weitere Anwendungen in Branchen wie Fertigung, Gesundheitswesen und Logistik.
Schlussfolgerung
Das neue System, das vom Team an der University of Texas in Dallas entwickelt wurde, stellt einen bedeutenden Fortschritt bei der Verbesserung der Objekterkennung und -segmentierung in Robotern dar. Durch den Einsatz von KI und das mehrmalige Drücken von Objekten, um eine Sequenz von Bildern zu erfassen, kann der Roboter verschiedene Objekte besser erkennen und segmentieren, selbst mit Variationen in Marken, Formen oder Größen. Diese Forschung hat das Potenzial, die Fähigkeiten und Effizienz von Robotern in verschiedenen Branchen erheblich zu verbessern.