In diesem Blogpost blicke ich zurück auf meine Promotion im Bereich Computer Vision, KI und Robotik, aber vor allem schaue ich in die Zukunft: Welche Herausforderungen werden uns auch in den kommenden Jahren in diesem dynamischen Feld begleiten? Vom äußeren Erscheinungsbild zukünftiger Roboter über die innere Beschaffenheit intelligenter Systeme bis hin zur Integration in Alltag und Gesellschaft: zehn entscheidende Fragen zu Robotern und Künstlicher Intelligenz, die noch unbeantwortet sind.
Inmitten der aufblühenden Begeisterung für ChatGPT und ähnliche KI-Modelle könnte man den Eindruck bekommen, dass wir lediglich ein paar Updates von hyperintelligenten Robotern entfernt sind – einfach die KI in ein schickes Gehäuse packen und schon befreit der smarte Helfer uns von allen Mühen. Doch die Wirklichkeit sieht ein bisschen anders aus.
Vor etwas mehr als vier Jahren habe ich meine Doktorarbeit abgeschlossen, die sich mit dem Problem befasste, Robotern den Umgang mit verformbaren Objekten wie Kleidungsstücken beizubringen. Die Idee, einen solchen Roboter im Alltag nutzen zu können, stellte mich vor zahlreiche grundlegende aber auch ganz praktische Fragen. Die meisten dieser Fragen sind bis heute nicht abschließend geklärt.
Ich liebe die Filmserie Zurück in die Zukunft. Deshalb habe ich sogar mit einer Szene aus dem zweiten Teil meine Doktorarbeit eingeleitet: Marty McFly ist zu sehen, wie er selbstbindende Schuhe anzieht (mit so genannten Power Laces) sowie eine Jacke mit Ärmeln, die zunächst viel zu groß sind, sich aber auf Knopfdruck an die Arme des Trägers anpassen. In einer anderen Szene, als die Hauptfigur in einen Pool fällt und nass wird, startet die Jacke automatisch einen Selbsttrocknungsmodus. In dieser Zukunftsvision werden also gar keine Roboter benötigt, weil die Objekte selbst intelligent sind. In meinem Promotionsprojekt habe ich dennoch den Roboter-Ansatz verfolgt. So können die Alltagsgegenstände bleiben, wie sie sind, und jede*r entscheidet selbst, ob er oder sie in Zukunft digitalisierte Kleidungsstücke anziehen möchte oder nicht. Aber was hindert uns eigentlich daran, smarte Objekte und smarte Roboter zu entwickeln?
Den Robotern gehört die Zukunft. Werden wir also in ein paar Jahren alle eine ganze Armada von Robotern zuhause haben: einer mäht den Rasen, einer putzt, einer spielt mit den Kindern und ein vierter bringt uns das Frühstück ans Bett? Oder gibt es dann einen Roboter, der alles kann? Und wie sähe so ein General-Purpose-Roboter aus? Ein naheliegender Ansatz wäre es, diesen Roboter menschenähnlich (humanoid) zu gestalten und – wie die oben abgebildete Roboterhand – mit fünf Fingern auszustatten, denn viele Aufgaben und Objekte in unserer Umgebung sind für die menschliche Hand gemacht. Ein Nachteil humanoider Roboter ist jedoch, dass sie in der Regel keine Fähigkeiten besitzen, die weit über die von Menschen hinausgehen: Sie können nicht fliegen, als OP-Roboter im Körperinneren eingesetzt werden oder sich selbst zerstören.
Ich habe es eingangs schon angedeutet: ChatGPT auf Rädern macht nach Meinung vieler Wissenschaftler noch keinen intelligenten Roboter. Doch warum eigentlich nicht? Der Grund hierfür liegt in der sogenannten Embodiment-These. Diese besagt, dass Kognition häufig physische Interaktion mit der Umgebung voraussetzt. Wenn wir Menschen uns im Raum bewegen, nehmen wir ständig neue Informationen auf. Außerdem verändern wir durch motorische Aktivität unsere Umgebung, was wiederum die Wahrnehmung verändert und möglicherweise verbessert. Im Rahmen meines Promotionsprojekts habe ich Experimente durchgeführt, in denen ein Roboter diese als Interactive Perception bezeichnete Strategie angewendet hat (siehe Abbildung oben): Indem er das Kleidungsstück greift und ein wenig anhebt, verformt sich der Stoff auf eine Weise, die dem Roboter die Erkennung der Öffnung vereinfacht.
Beim Robocup treten Roboter im Fußball sowie in den Disziplinen Rettungs- und Haushaltsroboter gegeneinander an. Die wichtigste Regel: Nach dem „Anpfiff“ dürfen die Entwickler nicht mehr eingreifen und die Roboter agieren und reagieren vollkommen eigenständig auf manchmal unvorhersehbare Ereignisse. Das unterscheidet sie von ferngesteuerten Robotern, aber auch von Industrierobotern, die mit hoher Präzision immer wieder eine vorher einprogrammierte Bewegung ausführen. Beispiele für autonome Roboter, die sich selbständig in ihrer Umgebung zurechtfinden, sind Saugroboter und – im weiteren Sinne – selbstfahrende Autos. Im engeren Sinne ist ein Roboter erst dann wirklich autonom, wenn er sich selbst mit Energie versorgt oder sogar selbstgesteckte Ziele verfolgt (siehe Frage 9). Aber wollen wir Menschen solche Roboter?
Symbolische KI verwendet Regeln und Symbole, um Probleme zu lösen, während subsymbolische KI auf maschinelles Lernen und die Verarbeitung von Informationen auf niedrigerer Ebene setzt. Über Jahrzehnte hinweg existierten beide Paradigmen auf dem Gebiet der Künstlichen Intelligenz parallel und wurden als praktisch gleichwertig angesehen. Heute dominieren künstliche neuronale Netze, die mit umfangreichen Datensätzen trainiert werden. Diese Methode hat große Erfolge erzielt, hat jedoch auch ihre Schattenseiten, darunter Intransparenz, hoher Rechenaufwand und potenzielle Gefahren, wenn das Training und Testen mit Robotern in der echten Welt stattfindet. Eine alternative Herangehensweise besteht darin, verschiedene KI-Ansätze zu kombinieren. Beispielsweise kann beim Umgang mit Kleidungsstücken topologisches Vorwissen (eine Hose hat drei Öffnungen) explizit modelliert werden, während der Roboter komplexe Bewegungsabläufe implizit erlernt.
Jeder intelligente Roboter ist auf Sensoren angewiesen, um seine Umgebung wahrnehmen zu können. Drei der klassischen fünf menschlichen Sinne – Hören, Sehen und Tasten – werden von Robotern durch Mikrofone, Kameras und taktile Sensoren, wie sie beispielsweise in den Fingerspitzen des oben abgebildeten Roboters integriert sind, simuliert. Hinzu kommt die Propriozeption, also die Selbstwahrnehmung des Roboters. Riechen und Schmecken können die meisten Roboter noch nicht, es wird aber bereits mit biologischen Sensoren echter Tiere experimentiert. Die Diskussion darüber, ob und welche weiteren Sinnesmodalitäten Roboter benötigen, ist brandaktuell. In der Praxis nutzen viele Roboter Ultraschall- oder Infrarotsensoren, um Entfernungen wahrzunehmen. Elon Musk hat jedoch bei den selbstfahrenden Autos von Tesla jüngst auf ein rein kamerabasiertes System umgestellt, und sich damit angeblich sogar über die Bedenken und Empfehlungen seiner eigenen Ingenieure hinweggesetzt.
Die Frage, was Roboter dürfen oder nicht dürfen, ist so alt wie die Robotik selbst. Bereits 1942 hat Isaac Asimov in seiner Kurzgeschichte „Runaround“ folgende Robotergesetze aufgestellt:
Insbesondere Militärroboter halten sich nicht an diese Regeln, die aber rein ethischer Natur sind. Mit dem vermehrten Einsatz von Robotern im Alltag wird es immer häufiger auch zu juristischen Auseinandersetzungen kommen, in denen die Frage nach der Schuld im Mittelpunkt steht, nachdem eben doch Menschen zu Schaden gekommen sind. Mögliche Verantwortliche in solchen Fällen könnten der Nutzer des Roboters, das Herstellerunternehmen, einzelne Entwickler oder Entwicklerinnen sowie gegebenenfalls der Anbieter eines Trainingsdatensatzes sein. Es wird interessant sein zu beobachten, wie sich die Rechtslage im Zuge fortschreitender technologischer Entwicklungen verändert.
Als Uncanny Valley wird der Effekt bezeichnet, dass Roboter, die sehr menschenähnlich, aber dennoch unnatürlich wirken, häufig Unbehagen auslösen. Im Jahr 2016 hatte ich die Gelegenheit, an einer Robotik-Konferenz in Tokio teilzunehmen, zu der Masahiro Mori, der zu diesem Zeitpunkt bereits 89 Jahre alte Entdecker des Uncanny Valley, eingeladen war. Mit ihm diskutierten dutzende Wissenschaftler aus verschiedenen Disziplinen darüber, welche Faktoren beeinflussen, ob Roboter von uns Menschen als vertrauenswürdig wahrgenommen werden oder nicht: vom Design über bestimmte Verhaltensweisen und Sprache bis hin zu Geschlechtszuschreibungen. Ob wir in Zukunft gut und gerne mit Robotern zusammenleben und arbeiten, hängt also bei Weitem nicht nur davon ab, wie effizient und fehlerfrei die Roboter funktionieren.
Machine Learning ist im Wesentlichen die stochastische Optimierung einer Zielfunktion. Die Wahl der Zielfunktion (bzw. der Kosten-, Fitness- oder Belohnungsfunktion) beeinflusst das Verhalten moderner Roboter und KIs also maßgeblich. Sie wird in der Regel explizit von den Entwicklern vorgegeben oder, seltener, aus dem Verhalten menschlicher Vorbilder abgeleitet. Beispiele für solche Ziele sind, einen Dialog so fortzusetzen wie es ein menschlicher Gesprächspartner gemäß Trainingsdaten tun würde (ChatGPT), oder so Fußball zu spielen, dass die Wahrscheinlichkeit ein Tor zu erzielen maximiert wird. Manche Ziele (z.B. beim Fußball ein Tor zu erzielen) sind so schwer zu erreichen, dass Teilziele definiert werden müssen (Reward Shaping). Dabei ist jedoch Vorsicht geboten: Wird ein Fußball-Roboter „belohnt“, wenn er sich mit dem Ball dem Tor nähert, aber nicht „bestraft“, wenn er sich vom Tor entfernt, erlernt er womöglich nur das endlose Dribbeln im Kreis. Der schwedische Philosoph Nick Bostrom spekulierte in einem Gedankenexperiment (hier als Browser-Game), dass eine Allgemeine KI, deren einziges Ziel die Herstellung möglichst vieler Büroklammern wäre, sogar die Auslöschung der Menschheit in Kauf nehmen würde, nur um dieses Ziel zu erreichen. Wir sollten also vorsichtig damit sein, was wir uns von Robotern wünschen, denn wir könnten es bekommen. Das gilt insbesondere für den Wunsch, Roboter zu erschaffen, die ihre Ziele selbst festlegen.
Ja, Roboter sind die Ausländer des 21. Jahrhunderts. Nein, im Ernst: Wenn die Roboter der Zukunft uns nicht einen signifikanten Teil der täglichen Arbeit abnehmen, wäre ich enttäuscht – schließlich bedeutet das tschechische Wort robota „Arbeit“ oder „Zwangsarbeit“. Es gibt auf dieser Welt genügend schöne und sinnvolle Dinge zu tun. Warum wäre es so schlimm, wenn Roboter uns die Lohnarbeit wegnehmen würden? Das liegt an der Art und Weise, wie auf dem freien Markt gewirtschaftet wird, oder besser gesagt: an der zugrunde liegenden Zielfunktion (siehe Frage 9), nämlich der individuellen Maximierung von Privateigentum, also Geld. Eine alternative Zielfunktion wäre beispielsweise die Maximierung des gesamtgesellschaftlichen Wohlstands bei gleichzeitiger Minimierung der von Menschen zu leistenden Arbeit. Es ist eine offene politische Frage, ob die Menschheit einen Wettbewerb der Ideen mit einer derartigen Zielfunktion überhaupt anstrebt, oder ob sie sich weiterhin an die Hoffnung klammert, dass es sich bei unserer Geldwirtschaft um ein geeignetes Reward Shaping des Ziels Wohlstand für alle handelt.
Das internet cafe of things ist ein Angebot von
Dr. Lukas Twardon
Dammwiese 23
33613 Bielefeld
Deutschland
Kontakt:
Telefon: +49 521 94594201
E-Mail: mail@icot.de
USt-IdNr.:
Umsatzsteuer-Identifikationsnummer gemäß §27a UStG:
DE341228849
Streitbeilegung:
Die EU-Kommission stellt eine Plattform für die außergerichtliche Online-Streitbeilegung (OS) bereit:
https://ec.europa.eu/consumers/odr
Ich bin weder bereit noch verpflichtet, an einem Streitbeilegungsverfahren vor einer Verbraucherschlichtungsstelle teilzunehmen.
Ich nehme den Schutz deiner Daten sehr ernst. Ich behandle personenbezogene Daten vertraulich und im Rahmen der gesetzlichen Vorschriften. In dieser Datenschutzerklärung erfährst du, was mit deinen Daten passiert, wenn du die Website besuchst.
Verantwortlicher gemäß Art. 4 Abs. 7 EU-Datenschutz-Grundverordnung (DSGVO) ist
Dr. Lukas Twardon
Dammwiese 23
33613 Bielefeld
Deutschland
Telefon: +49 521 94594201
E-Mail: mail@icot.de
Die Nutzung von icot.de erfolgt möglichst datensparsam. Die Website erhebt und verarbeitet Daten seiner Nutzer, die benötigt werden, um den Dienst anbieten zu können. Außerdem können persönliche Daten verarbeitet werden, wenn die Datenverarbeitung zur Finanzierung, Absicherung oder Verbesserung des Angebots notwendig oder rechtlich erforderlich ist, oder wenn du deine Einwilligung erteilst.
Die Website icot.de wird bei einem externen Dienstleister (Hetzner Online GmbH) gehostet, dessen zertifizierte Rechenzentren sich ausschließlich innerhalb der EU befinden. Die Log-Dateien des Hosters speichern die anonymisierte IP-Adresse des Nutzers, den verwendeten Browser (wenn übermittelt), das verwendete Betriebssystem sowie den Zeitpunkt der Anfrage. Um die datenschutzkonforme Verarbeitung zu gewährleisten, wurde ein Vertrag zur Auftragsverarbeitung (AV-Vertrag) mit dem Hoster abgeschlossen.
Die anonymisierten Log-Dateien werden dauerhaft auf dem Server gespeichert.
Cookies sind kleine Textdateien, die beim Aufruf von Webseiten temporär auf deinem Gerät gespeichert werden und die Identifizierung des Webbrowsers bei erneuten Aufrufen ermöglichen. Die Nutzung von icot.de erfolgt ohne die Verwendung von Cookies.
Alle Daten werden TLS-verschlüsselt per HTTPS übertragen. Das bedeutet, dass die Daten, die vom Endgerät zum Server oder andersherum gesendet werden, nicht von Dritten gelesen werden können.
Wenn du eine Nachricht an mail@icot.de schickst, kann diese gespeichert werden, um sie zu bearbeiten, um das Angebot und den Support zu verbessern oder um dich zu kontaktieren.
Verantwortlicher im Sinne der DSGVO für die Pinterest- und LinkedIn-Seiten des internet cafe of things bin ich gemeinsam mit dem jeweiligen Anbieter, also Pinterest Europe Limited bzw. LinkedIn Ireland Unlimited. Die Datenverarbeitung im Zusammenhang mit den Social-Media-Seiten erfolgt gemäß Art. 6 Abs. 1 f DSGVO aufgrund meines berechtigten Interesses an Kommunikation und Öffentlichkeitsarbeit. Deine Daten (z.B. Kommentare, Postings, Likes, Bilder oder Videos) werden durch den jeweiligen Anbieter veröffentlicht. Ich verwende diese Daten nicht für andere Zwecke. Gegebenenfalls teile ich deine Beiträge auf der jeweiligen Plattform, soweit diese Funktion angeboten wird. Außerdem behalte ich mir vor, falls möglich und erforderlich, Inhalte von meinen Social-Media-Seiten zu löschen. Pinterest und LinkedIn setzen Cookies und ähnliche Speichertechnologien ein. Bei Datenübertragungen in die USA stützen sich die Anbieter auf Standardvertragsklauseln, die von der Europäischen Kommission als Mittel zur Gewährleistung eines angemessenen Schutzes bei der Übermittlung von Daten außerhalb der EU genehmigt worden sind. Ich habe nur äußerst begrenzt Einfluss darauf, wie Pinterest und LinkedIn deine Daten verarbeiten. Informationen dazu findest du unter https://policy.pinterest.com/privacy-policy bzw. https://linkedin.com/legal/privacy-policy.
Gemäß EU-Datenschutz-Grundverordnung (DSGVO) hast du als Betroffener folgende Rechte:
Ich behalte mir das Recht vor, diese Datenschutzerklärung zu ändern. Die aktuelle Version ist jederzeit auf der Website abrufbar.