2. Maschinelles Lernen und KI

Arrc

Überwachtes Lernen

Beim überwachten Lernen benötigen wir „gelabelte“ Daten, das sind Daten, die bereits in Kategorien eingeteilt sind. Zum Beispiel könnten wir Bilder von Autos, Fahrradfahrern und Fußgängern verwenden, die alle beschriftet wurden, um ein System für die Bilderkennung beim autonomen Fahren zu entwickeln. Ein Teil dieser gelabelten Daten wird vom Algorithmus verwendet, um Regeln zu erstellen, die helfen, die Daten den Kategorien zuzuordnen. Diese Daten werden Trainingsdaten genannt. Mit diesen Trainingsdaten lernt der Algorithmus, eigenständig Daten zu sortieren, basierend auf den Regeln, die er gelernt hat. Da der Algorithmus beim überwachten Lernen mit den vom Datenersteller gelabelten Daten lernt, sprechen wir vom „überwachten“ Lernen. Die Qualität der erstellten Regeln wird dann mit weiteren markierten Daten, den Testdaten, überprüft. Auf diese Weise entstehen nach und nach Modelle, die Muster erkennen und Vorhersagen treffen können, indem der Algorithmus aus den vorhandenen Daten lernt und die Muster auf neue, ungelabelte Eingaben anwendet.

Gemeinsam mit eurer Lehrkraft spielt ihr nun nach, wie ein KI-System durch überwachtes Lernen trainiert werden kann. Stell dir vor, du bist Tierpfleger bzw. Tierpflegerin in einem Zoo und betreust verschiedene Affen. Nun musst du entscheiden, welche der Äffchen bissig sind und welche nicht.

Informationen für Lehrkräfte

Sie finden das Spiel unter https://www.aiunplugged.org/german.pdf, es ist auf den Seiten 4–7 erklärt.

Die Äffchenkärtchen sind unter https://www.aiunplugged.org/activity1.pdf zu finden.

Steht eine Projektionsfläche zur Verfügung, so bietet es sich an, die Präsentation https://view.officeapps.live.com/op/view.aspx?src=https%3A%2F%2Fwww.aiunplugged.org%2Factivity1.pptx&wdOrigin=BROWSELINK statt der ausgedruckten Karten zu verwenden.

Es wird empfohlen, das Spiel mit der ganzen Klasse gleichzeitig zu spielen. Die Schülerinnen und Schüler sollen jeweils eigene Entscheidungsbäume zeichnen und ihre so entstehenden Algorithmen bei der Auswertung der Testdaten an ihren Nachbarn weitergeben.

Falls den Schülerinnen und Schülern keine Entscheidungsbäume bekannt sind, müssen diese entsprechend in der Einführung thematisiert werden.

Reflexion

Reflektiere in den folgenden Aufgaben, was du gerade gelernt hast.

Wie bist du vorgegangen, um zu entscheiden, ob ein Äffchen beißt oder nicht?

Warum hat dein Algorithmus (wahrscheinlich) nicht jedes Bild korrekt zuordnen können?

Überlege dir Situationen und Anwendungen, in denen ein nicht funktionierender Algorithmus problematisch sein könnte.

Auf was sollte bei der Auswahl der Trainingsdaten geachtet werden?

Unüberwachtes Lernen

Im Unterschied zum überwachten Lernen stehen beim unüberwachten keine gelabelten Daten zur Verfügung. Zum Beispiel könnten wir bei der Bilderkennung viele Bilder von Früchten haben, aber ohne Zuordnung zu bestimmten Obstsorten. Der Algorithmus muss nun die Ähnlichkeiten zwischen den Daten nutzen, um sie zu gruppieren, basierend auf gemeinsamen Merkmalen (Attributen) wie Farbe und Form. Dabei geht man davon aus, dass ähnliche Daten auch ähnliche Merkmalsausprägungen haben.

Man spricht in diesem Fall von „unüberwachtem“ Lernen, weil die Daten nicht schon im Voraus vom Ersteller gelabelt wurden und dem Algorithmus somit keine Kategorien vorgegeben wurden. So könnten zum Beispiel alle gelben, gebogenen Früchte gruppiert und mit einem Label versehen werden, und alle grünen, runden Früchte anhand eines anderen Labels in einer andere Gruppe sortiert werden. Nachdem auf diese Weise ähnliche Daten in einzelne Gruppen zusammengefasst wurden, müssen noch die Ausreißer gefunden werden - das sind Daten, die nicht in die Gruppen passen. In unserem Fruchtbeispiel könnten das exotische Früchte sein, die sich von den anderen deutlich unterscheiden.

Um das unüberwachte Lernen besser zu verstehen, wollen wir uns nun auf die Suche nach Gold begeben! Stellt euch vor, ihr seid in Amerika zur Zeit des großen Goldrauschs mit drei Grabungsteams. Anhand von Berichten über frühere Goldfunde und einer Karte sollt ihr die besten Grabungsorte ausfindig machen.

Informationen für Lehrkräfte

Spielmaterialien

Die Spielmaterialien sind auf der Seite https://computingeducation.de/proj-snaip-B/ zu finden. Diese müssen ausgedruckt und vorbereitet werden. Optional ist dort eine Unterrichtsidee vorgestellt, wie vertieft aufbauend auf dem Goldsuchspiel auf unbewachtes Lernen eingegangen werden kann.

Für die folgende Aufgabe benötigst du einige Spielmaterialien. Erkundige dich danach bei deiner Lehrkraft!

Stellt eure Goldgräberteams nun auf 3 zufällige Startpositionen. Auf den Karten, die ihr aufdeckt, werden Koordinaten zu sehen sein, bei denen andere Menschen Gold gefunden haben. Es ist also denkbar, dass dort noch mehr zu finden ist.

Aufgabe:

Entwickelt einen festen Algorithmus, der das Ziel hat, Eure 3 Goldgräberteams möglichst mittig in Goldvorkommen zu lenken.
Deckt anschließend eine Karte nach der anderen auf und befolgt jeweils euren Algorithmus.
Lasst euch nach allen Karten von eurer Lehrkraft die Lösungsfolie geben. Wie gut war euer Algorithmus? Wie könnt ihr ihn anpassen, damit er besser wird? Passt euren Algorithmus an, mischt die Karten und spielt noch eine Runde!

Aufgabe

Beantworte die folgenden Fragen und trage sie hier ein:

Zusatzinformation für Interessierte

Unüberwachtes maschinelles Lernen findet auch beim Erstellen neuer Bilder durch KI statt. So analysiert die KI viele vorhandene Bilder, erkennt Muster und Merkmale und verwendet diese, um neue Bilder zu erstellen, die diesen ähnlich sind. Ein Beispiel dafür sind die Generative Adversarial Networks (GANs). Hier gibt es zwei Teile: einen, der Bilder erzeugt (Generator), und einen anderen, der versucht zu raten, ob das Bild echt oder von der KI erzeugt wurde (Diskriminator). Der Generator wird immer besser darin, realistische Bilder zu erzeugen, indem er aus den vorhandenen Bildern lernt, ohne explizit gesagt zu bekommen, wie das Bild aussehen soll.

Glaubst du, bei digitalen Bildern immer zu erkennen, ob sie von Menschen oder von einer KI geschaffen wurden? Mach den Test und finde mit folgendem Quiz heraus, ob du echte Gemälde und Fotos von KI-generierten unterscheiden kannst!

Bestärkendes Lernen

Im Gegensatz zu den beiden vorhergehenden Verfahren werden beim bestärkenden Lernen keine Daten verwendet. Stattdessen lernt der Algorithmus durch Ausprobieren und erhält Belohnungen für gute Entscheidungen sowie Bestrafungen für schlechte. Der Algorithmus erfasst hier selbstständig Informationen, die im Hinblick auf sein Ziel relevant sind. So kann beispielsweise ein Serviceroboter das Verhalten und die Stimmung eines Kunden analysieren und entscheidet sich auf dieser Grundlage für eine seiner vorgegebenen Handlungsmöglichkeiten. Wählt der Algorithmus eine Alternative aus, die ihn näher an sein Ziel bringt, wird er belohnt. Durch die Reaktion des Kunden lernt der Serviceroboter, welche Handlungen erfolgreich sind und passt seine Strategie entsprechend an, indem erfolgreiche Handlungen verstärkt und nicht erfolgreiche abgeschwächt werden. Bei einer positiven Rückmeldung wird der Serviceroboter die Handlung in einer ähnlichen Situation wiederholen. Reagiert der Kunde negativ auf das Verhalten des Roboters, wird diese Handlungsalternative mit einer geringeren Wahrscheinlichkeit eingesetzt.

Schlag' das Krokodil

Nach so viel Theorie könnt ihr das Prinzip des bestärkenden Lernens nun einmal spielerisch ausprobieren. Wie lernen wir als Mensch ein Brett- oder Videospiel zu spielen? Vielleicht beobachten wir andere beim Spielen, vielleicht probieren wir aus, wie bestimmte Aktionen oder Spielzüge das Spiel beeinflussen. Je öfter wir gewinnen, desto besser werden wir in einem Spiel. Wir entwickeln Strategien, mit welchen Zügen wir in bestimmten Spielsituationen am erfolgreichsten sind. Auf dieselbe Weise lernt auch ein Computer.

Bei „Schlag das Krokodil“ könnt ihr mitverfolgen, wie der Computer von Spiel zu Spiel besser wird.

Kurzanleitung

Ihr spielt gegen den Computer und versucht dabei, so oft wie möglich zu gewinnen. Ihr werdet sehen, dass der Computer jeweils das aktuelle Spielfeld mit den Zugmöglichkeiten (rechts im Bild) vergleicht. Im Anschluss zieht der Computer zufällig einen der farbigen Punkte, die sich neben der jeweiligen Spielsituation befinden. Die Punktfarbe bestimmt, welcher Zug ausgeführt wird. Wird beispielsweise ein roter Punkt gezogen, wird der Roboter dem roten Pfeil folgend bewegt. Beobachtet, was mit den Punkten passiert, wenn der Computer gewonnen oder verloren hat.

Es gelten folgende Regeln:

Du spielst die Affen und kannst diese durch Ziehen bewegen.
Das Spielfeld besteht aus 3x3 Feldern.
Beide Spieler haben je 3 Figuren, die wie die Bauern beim Schach ziehen dürfen: Entweder ein Feld nach vorne oder schräg eine gegnerische Figur schlagen.

Der Gegner ist besiegt, wenn ...

... alle seine Figuren aus dem Spiel geworfen wurden (diagonal wie die Bauern beim Schach),
... er am Zug ist, aber mit allen Figuren für weitere Bewegungen blockiert ist oder
... man mit einer eigenen Figur die Spielfeldseite des Gegners erreicht.

Informationen für Lehrkräfte

Das Spiel zur Illustration bestärkenden Lernens lässt sich gut einleiten, in dem Sie die SuS zunächst fragen, wie sie bei Videospielen lernen, um die verschiedenen Levels zu bestehen. Die SuS erzählen von ihren Lernstrategien, die wahrscheinlich darin bestehen, dass sie Aktionen, die zu Erfolg führen vermehrt ausführen und solche die zu Bestrafungen führen vermeiden. Diese Lernstrategie benutzt der Mensch auch im Alltag: Strafen in der Schule, gute Noten bei einem Test, Strafzettel im Straßenverkehr, Punkteführerschein usw.

Daraufhin erklären Sie, dass auch KI-Systeme auf diese Art und Weise autonom lernen und dies in vielen Videospielen genutzt wird. Auch werden viele KI-Systeme zuerst an Spielen getestet, da diese ein überschaubares Regelwerk besitzen und weniger komplex sind als die Realität. Sehr bekannt wurde KI durch seinen Sieg gegen den Schachweltmeister Kasparov im Jahre 1997 (Deep Blue) und gegen den Weltmeister im Go-Spiel im Jahre 2016 (IBM Watson).

Im Kleinen lässt sich das am Bauernschach bzw. dem Spiel „Schlag das Krokodil“ nachvollziehen. Die Spielregeln stammen vom richtigen Schachspiel: Die Bauernfigur kann geradeaus auf das vor ihr liegende Feld ziehen, wenn dieses frei ist, oder diagonal nach vorne, um einen gegnerischen Bauern zu schlagen. Gewonnen hat die/der SpielerIn, die/der es schafft, die eigene Spielfigur an das andere Ende des Spielfeldes zu führen, oder alle gegnerischen Figuren geschlagen hat oder erreicht, dass der Gegner in der nächsten Runde keinen Spielzug mehr ausführen kann.

Demonstrieren Sie zunächst die Funktionsweise der Website https://www.stefanseegerer.de/schlag-das-krokodil und erklären Sie die Spielregeln. Darüber hinaus ist es wichtig, dass die SuS die Bedeutung der farbigen Punkte verstehen (entsprechen der gleichfarbigen Aktion) und sehen, dass diese Punkte entfernt oder hinzugefügt werden können.

Bevor eine neue Runde gespielt wird, passt der Computer seine Strategie wie folgt an:

Computer hat gewonnen: Ein Token in der Farbe des letzten, siegbringenden Spielzugs wird zusätzlich auf das Feld dieses Spielzugs gelegt.
Mensch hat gewonnen: Das Token, das den letzten Zug der Computer-Spielerin bzw. des Computer-Spielers bestimmt hat, wird entfernt.

Lassen Sie die SuS nun einige Runden allein spielen. Ziel ist es, so oft wie möglich zu gewinnen, bevor die KI nicht mehr geschlagen werden kann. Dies scheint eine einfache Aufgabe zu sein, aber bald werden die SuS erkennen, dass sie ein gutes Verständnis des Innenlebens benötigen, um über 10 oder sogar über 20 Siege zu erzielen. Achtung, wenn die Seite neu geladen wird, werden auch die Gewinne zurückgesetzt!

Reflexion: Die SuS werden erkennen, dass sie zu Beginn noch oft gewinnen. Nach einigen Runden wird der Computer jedoch immer besser, da durch bestärkendes Lernen nur die Spielzüge übrigbleiben, die zu einem Gewinn führen. Schlussendlich werden die SuS nicht mehr gegen den Computer gewinnen können. Sie sollten erkennen, dass sie gezielt Züge machen müssen, die sie zuvor noch nicht verwendet haben, um die KI in unbekanntes Gebiet zu „zwingen“. Es ist auch gut ersichtlich, dass die Anzahl der möglichen Zustände mit der Anzahl der verfügbaren Aktionen recht schnell zunimmt. Man kann sich leicht vorstellen, dass es auf einem größeren Brett (wie z.B. einem Schachbrett) so viele mögliche Zustände gibt, dass es nicht möglich ist, eine KI von Hand zu trainieren oder sogar generell alle möglichen Zustände einzubeziehen. Wichtig ist auch die Qualität des menschlichen Spielers: Verliert die Maschine nicht, entwickelt sie sich auch nicht weiter. Verliert sie aber, wird jeweils der letzte Zug, der in direkter Folge zum Verlieren geführt hat, eliminiert, d. h. aus der Ergebnisübersicht gestrichen. Dies stellt eine negative Bestärkung (Bestärkung erfolgreicher Handlung findet hier nicht statt) dar, da der Zug in Zukunft mit Sicherheit nicht mehr angewendet wird. Die Maschine lernt auf diese Weise besser zu spielen.

Zur Vertiefung siehe auch https://computingeducation.de/proj-schlag-das-kroko/.

Aufgabe

Beschreibe nun, was du beobachtet hast:

Wie sind die Spielrunden verlaufen?
Wie hat der Computer gelernt?
Mit welcher Strategie gelingt es, das Krokodil länger zu besiegen?

Nachdem wir nun einen Einblick bekommen haben, wie künstliche Intelligenz lernen kann, wollen wir uns nun dem widmen, was mit ihr möglich ist. Gemeinsam mit Nele und Emma schauen wir auf die Entwicklung von KI – von ihren Anfängen bis hin zu Zukunftsaussichten.