Bestärkendes Lernen – interaktive Lerneinheit

Übersicht

Sekundarstufe

Naturwissenschaft und Technik, Mathematik, Informatik

Deutsch

Bestärkendes Lernen am Beispiel einer interaktiven Simulation

Schlüsselwörter: Machine Learning, KI-Anwendungen
Fächer: Informatik, Mathematik, Naturwissenschaften und Technik
Altersstufe der Schüler*innen: ab 14 Jahre
Zeitrahmen: 2 Doppelstunden

Dieses Material ist für selbstorganisiertes Lernen geeignet. Es besteht aus einer problematisierenden Einführung in das Thema Bestärkendes Lernen, einer Anleitung mit Hintergrundwissen zur Simulation und der eigentlichen interaktiven Simulation am Beispiel einer Goldsuche in einer zweidimensionalen Gitterwelt.

Benötigte Hardware/Software:

Internetzugang
PCs/Laptops/Chromebooks/Tablets

Autor: Samuel Richter, mit einer unterrichtspraktischen Einleitung von Daniel Janssen

Inhaltsübersicht

Einführung mit Aufgaben: manuelles Steuern eines Roboters
Bestärkendes Lernen: einen Roboter Erfahrungen sammeln lassen
Anleitungen und Informationen zur Simulation
Simulation Bestärkendes Lernen (externer Link)

Zusammenfassung

Wie kann künstliche Intelligenz (im Folgenden als KI abgekürzt) ein so komplexes Spiel wie Go lernen, das wesentlich komplizierter als Schach ist, und dabei sogar die besten Spieler der Welt schlagen? Wie kann eine solche KI es schaffen, Computerspiele bis zum letzten Level fehlerfrei durchzuspielen, und wie ist es möglich, dass Roboter selbstständig Bewegungen wie das Gehen lernen können? Die Antwort lautet: Es handelt sich hierbei um eine ganz bestimmte Art des sogenannten maschinellen Lernens, nämlich um das bestärkende Lernen, das im Englischen als Reinforcement Learning bezeichnet wird.

Im Themenbereich der künstlichen Intelligenz geht es allgemein darum, wie Maschinen bzw. Computerprogramme (selbstständig) lernen können. Man unterscheidet dabei grob drei Bereiche: das überwachte Lernen, das unüberwachte Lernen und eben das bestärkende Lernen. Letzteres arbeitet mit Belohnungen und Bestrafungen und soll hier an einem ganz konkreten interaktiven Beispiel vorgestellt werden: Es geht um die Fragestellung, wie ein Roboter auf einem 5x5 Felder großen Spielfeld von alleine lernt, Hindernissen auszuweichen und das Zielfeld mit einem versteckten Goldstück zu finden.

Dies kann in einer interaktiven Simulation ausprobiert und nachvollzogen werden. Einleitend sollen hier einige Vorüberlegungen stattfinden, wie man überhaupt einem Roboter durch Programmieren beibringen könnte, sich automatisch in seiner Spielfeldwelt zu bewegen, und welche Schwierigkeiten das bereits mit sich bringt. Denn so einfach, wie man denken könnte, ist es nicht.