2. Maschinelles Lernen und KI

Anmelden
§

https://www.pexels.com/de-de/foto/abstrakt-technologie-forschung-lernen-17483871/

PexelsBYSA

2. Maschinelles Lernen und KI

1
§

© Digitale Lernwelten GmbH

Arrc
2
§

© Digitale Lernwelten GmbH

Arrc

Überwachtes Lernen

3
§

https://pixabay.com/de/vectors/affe-primas-s%C3%A4ugetier-gesicht-kopf-8065424/

Pixabay.com - LizenzBYSA

Beim ĂŒberwachten Lernen benötigen wir „gelabelte“ Daten, das sind Daten, die bereits in Kategorien eingeteilt sind. Zum Beispiel könnten wir Bilder von Autos, Fahrradfahrern und FußgĂ€ngern verwenden, die alle beschriftet wurden, um ein System fĂŒr die Bilderkennung beim autonomen Fahren zu entwickeln. Ein Teil dieser gelabelten Daten wird vom Algorithmus verwendet, um Regeln zu erstellen, die helfen, die Daten den Kategorien zuzuordnen. Diese Daten werden Trainingsdaten genannt. Mit diesen Trainingsdaten lernt der Algorithmus, eigenstĂ€ndig Daten zu sortieren, basierend auf den Regeln, die er gelernt hat. Da der Algorithmus beim ĂŒberwachten Lernen mit den vom Datenersteller gelabelten Daten lernt, sprechen wir vom â€žĂŒberwachten“ Lernen. Die QualitĂ€t der erstellten Regeln wird dann mit weiteren markierten Daten, den Testdaten, ĂŒberprĂŒft. Auf diese Weise entstehen nach und nach Modelle, die Muster erkennen und Vorhersagen treffen können, indem der Algorithmus aus den vorhandenen Daten lernt und die Muster auf neue, ungelabelte Eingaben anwendet.

Gemeinsam mit Eurer Lehrkraft spielt Ihr nun nach, wie ein KI-System durch ĂŒberwachtes Lernen trainiert werden kann. Stell dir vor, du bist Tierpfleger bzw. Tierpflegerin in einem Zoo und betreust verschiedene Affen. Nun musst du entscheiden, welche der Äffchen bissig sind und welche nicht.

4
§

Urheber: Stefan Seegerer, Tilman Michaeli, Sven Jatzlau

https://computingeducation.de/c5cc6feaa24720ab18da2d5a7b53b081/SoLernenMaschinen.pdf

CcBY

Informationen fĂŒr LehrkrĂ€fte

Sie finden das Spiel unter https://www.aiunplugged.org/german.pdf, es ist auf den Seiten 4–7 erklĂ€rt. 

Die ÄffchenkĂ€rtchen sind unter https://www.aiunplugged.org/activity1.pdf zu finden. 

Steht eine ProjektionsflĂ€che zur VerfĂŒgung, so bietet es sich an, die PrĂ€sentation https://view.officeapps.live.com/op/view.aspx?src=https%3A%2F%2Fwww.aiunplugged.org%2Factivity1.pptx&wdOrigin=BROWSELINK statt der ausgedruckten Karten zu verwenden.

Es wird empfohlen, das Spiel mit der ganzen Klasse gleichzeitig zu spielen. Die SchĂŒlerinnen und SchĂŒler sollen jeweils eigene EntscheidungsbĂ€ume zeichnen und ihre so entstehenden Algorithmen bei der Auswertung der Testdaten an ihren Nachbarn weitergeben.

Falls den SchĂŒlerinnen und SchĂŒlern keine EntscheidungsbĂ€ume bekannt sind, mĂŒssen diese entsprechend in der EinfĂŒhrung thematisiert werden.

Reflexion

5

Reflektiere in den folgenden Aufgaben, was du gerade gelernt hast.

6
A B C D

Wie bist du vorgegangen, um zu entscheiden, ob ein Äffchen beißt oder nicht?

Warum hat dein Algorithmus (wahrscheinlich) nicht jedes Bild korrekt zuordnen können?

Überlege dir Situationen und Anwendungen, in denen ein nicht funktionierender Algorithmus problematisch sein könnte.

Auf was sollte bei der Auswahl der Trainingsdaten geachtet werden?

A B C D

UnĂŒberwachtes Lernen

7
§

© Digitale Lernwelten GmbH, erstellt mit Canva

Arrc

Im Unterschied zum ĂŒberwachten Lernen stehen beim unĂŒberwachten keine gelabelten Daten zur VerfĂŒgung. Zum Beispiel könnten wir bei der Bilderkennung viele Bilder von FrĂŒchten haben, aber ohne Zuordnung zu bestimmten Obstsorten. Der Algorithmus muss nun die Ähnlichkeiten zwischen den Daten nutzen, um sie zu gruppieren, basierend auf gemeinsamen Merkmalen (Attributen) wie Farbe und Form. Dabei geht man davon aus, dass Ă€hnliche Daten auch Ă€hnliche MerkmalsausprĂ€gungen haben.

Man spricht in diesem Fall von „unĂŒberwachtem“ Lernen, weil die Daten nicht schon im Voraus vom Ersteller gelabelt wurden und dem Algorithmus somit keine Kategorien vorgegeben wurden. So könnten zum Beispiel alle gelben, gebogenen FrĂŒchte gruppiert und mit einem Label versehen werden, und alle grĂŒnen, runden FrĂŒchte anhand eines anderen Labels in einer andere Gruppe sortiert werden. Nachdem auf diese Weise Ă€hnliche Daten in einzelne Gruppen zusammengefasst wurden, mĂŒssen noch die Ausreißer gefunden werden - das sind Daten, die nicht in die Gruppen passen. In unserem Fruchtbeispiel könnten das exotische FrĂŒchte sein, die sich von den anderen deutlich unterscheiden.

Um das unĂŒberwachte Lernen besser zu verstehen, wollen wir uns nun auf die Suche nach Gold begeben! Stellt Euch vor, Ihr seid in Amerika zur Zeit des großen Goldrauschs mit drei Grabungsteams. Anhand von Berichten ĂŒber frĂŒhere Goldfunde und einer Karte sollt Ihr die besten Grabungsorte ausfindig machen.

8
§

Urheber: Stefan Seegerer, Tilman Michaeli, Sven Jatzlau

https://computingeducation.de/c5cc6feaa24720ab18da2d5a7b53b081/SoLernenMaschinen.pdf

CcBY

Informationen fĂŒr LehrkrĂ€fte

Spielmaterialien

Die Spielmaterialien sind auf der Seite https://computingeducation.de/proj-snaip-B/ zu finden. Diese mĂŒssen ausgedruckt und vorbereitet werden. Optional ist dort eine Unterrichtsidee vorgestellt, wie vertieft aufbauend auf dem Goldsuchspiel auf unbewachtes Lernen eingegangen werden kann.

9

Stellt eure GoldgrÀberteams nun auf 3 zufÀllige Startpositionen. Auf den Karten, die ihr aufdeckt, werden Koordinaten zu sehen sein, bei denen andere Menschen Gold gefunden haben. Es ist also denkbar, dass dort noch mehr zu finden ist.

Aufgabe:

  • Entwickelt einen festen Algorithmus, der das Ziel hat, eure 3 GoldgrĂ€berteams möglichst mittig in Goldvorkommen zu lenken.
  • Deckt anschließend eine Karte nach der anderen auf und befolgt jeweils euren Algorithmus.
  • Lasst euch nach allen Karten von eurer Lehrkraft die Lösungsfolie geben. Wie gut war euer Algorithmus? Wie könnt ihr ihn anpassen, damit er besser wird? Passt euren Algorithmus an, mischt die Karten und spielt noch eine Runde!
10

Aufgabe

Beantworte die folgenden Fragen und trage sie hier ein:

11

Zusatzinformation fĂŒr Interessierte

UnĂŒberwachtes maschinelles Lernen findet auch beim Erstellen neuer Bilder durch KI statt. So analysiert die KI viele vorhandene Bilder, erkennt Muster und Merkmale und verwendet diese, um neue Bilder zu erstellen, die diesen Ă€hnlich sind. Ein Beispiel dafĂŒr sind die Generative Adversarial Networks (GANs). Hier gibt es zwei Teile: einen, der Bilder erzeugt (Generator), und einen anderen, der versucht zu raten, ob das Bild echt oder von der KI erzeugt wurde (Diskriminator). Der Generator wird immer besser darin, realistische Bilder zu erzeugen, indem er aus den vorhandenen Bildern lernt, ohne explizit gesagt zu bekommen, wie das Bild aussehen soll.

Glaubst du, bei digitalen Bildern immer zu erkennen, ob sie von Menschen oder von einer KI geschaffen wurden? Mach den Test und finde mit folgendem Quiz heraus, ob du echte GemÀlde und Fotos von KI-generierten unterscheiden kannst!

BestÀrkendes Lernen

12

Im Gegensatz zu den beiden vorhergehenden Verfahren werden beim bestĂ€rkenden Lernen keine Daten verwendet. Stattdessen lernt der Algorithmus durch Ausprobieren und erhĂ€lt Belohnungen fĂŒr gute Entscheidungen sowie Bestrafungen fĂŒr schlechte. Der Algorithmus erfasst hier selbststĂ€ndig Informationen, die im Hinblick auf sein Ziel relevant sind. So kann beispielsweise ein Serviceroboter das Verhalten und die Stimmung eines Kunden analysieren und entscheidet sich auf dieser Grundlage fĂŒr eine seiner vorgegebenen Handlungsmöglichkeiten. WĂ€hlt der Algorithmus eine Alternative aus, die ihn nĂ€her an sein Ziel bringt, wird er belohnt. Durch die Reaktion des Kunden lernt der Serviceroboter, welche Handlungen erfolgreich sind und passt seine Strategie entsprechend an, indem erfolgreiche Handlungen verstĂ€rkt und nicht erfolgreiche abgeschwĂ€cht werden. Bei einer positiven RĂŒckmeldung wird der Serviceroboter die Handlung in einer Ă€hnlichen Situation wiederholen. Reagiert der Kunde negativ auf das Verhalten des Roboters, wird diese Handlungsalternative mit einer geringeren Wahrscheinlichkeit eingesetzt.

13
§

Urheber: Stefan Seegerer, Tilman Michaeli, Sven Jatzlau

https://computingeducation.de/c5cc6feaa24720ab18da2d5a7b53b081/SoLernenMaschinen.pdf

CcBY
14

Schlag' das Krokodil

Nach so viel Theorie könnt Ihr das Prinzip des bestĂ€rkenden Lernens nun einmal spielerisch ausprobieren. Wie lernen wir als Mensch ein Brett- oder Videospiel zu spielen? Vielleicht beobachten wir andere beim Spielen, vielleicht probieren wir aus, wie bestimmte Aktionen oder SpielzĂŒge das Spiel beeinflussen. Je öfter wir gewinnen, desto besser werden wir in einem Spiel. Wir entwickeln Strategien, mit welchen ZĂŒgen wir in bestimmten Spielsituationen am erfolgreichsten sind. Auf dieselbe Weise lernt auch ein Computer.

Bei „Schlag das Krokodil“ könnt Ihr mitverfolgen, wie der Computer von Spiel zu Spiel besser wird. 

Kurzanleitung

Ihr spielt gegen den Computer und versucht dabei, so oft wie möglich zu gewinnen. Ihr werdet sehen, dass der Computer jeweils das aktuelle Spielfeld mit den Zugmöglichkeiten (rechts im Bild) vergleicht. Im Anschluss zieht der Computer zufĂ€llig einen der farbigen Punkte, die sich neben der jeweiligen Spielsituation befinden. Die Punktfarbe bestimmt, welcher Zug ausgefĂŒhrt wird. Wird beispielsweise ein roter Punkt gezogen, wird der Roboter dem roten Pfeil folgend bewegt. Beobachtet, was mit den Punkten passiert, wenn der Computer gewonnen oder verloren hat.

Es gelten folgende Regeln:

  • Du spielst die Affen und kannst diese durch Ziehen bewegen.

  • Das Spielfeld besteht aus 3x3 Feldern.

  • Beide Spieler haben je 3 Figuren, die wie die Bauern beim Schach ziehen dĂŒrfen: Entweder ein Feld nach vorne oder schrĂ€g eine gegnerische Figur schlagen.

Der Gegner ist besiegt, wenn ...

  • ... alle seine Figuren aus dem Spiel geworfen wurden (diagonal wie die Bauern beim Schach),

  • ... er am Zug ist, aber mit allen Figuren fĂŒr weitere Bewegungen blockiert ist oder

  • ... man mit einer eigenen Figur die Spielfeldseite des Gegners erreicht.


Informationen fĂŒr LehrkrĂ€fte

Das Spiel zur Illustration bestĂ€rkenden Lernens lĂ€sst sich gut einleiten, in dem Sie die SuS zunĂ€chst fragen, wie sie bei Videospielen lernen, um die verschiedenen Levels zu bestehen. Die SuS erzĂ€hlen von ihren Lernstrategien, die wahrscheinlich darin bestehen, dass sie Aktionen, die zu Erfolg fĂŒhren vermehrt ausfĂŒhren und solche die zu Bestrafungen fĂŒhren vermeiden. Diese Lernstrategie benutzt der Mensch auch im Alltag: Strafen in der Schule, gute Noten bei einem Test, Strafzettel im Straßenverkehr, PunktefĂŒhrerschein usw.

Daraufhin erklĂ€ren Sie, dass auch KI-Systeme auf diese Art und Weise autonom lernen und dies in vielen Videospielen genutzt wird. Auch werden viele KI-Systeme zuerst an Spielen getestet, da diese ein ĂŒberschaubares Regelwerk besitzen und weniger komplex sind als die RealitĂ€t. Sehr bekannt wurde KI durch seinen Sieg gegen den Schachweltmeister Kasparov im Jahre 1997 (Deep Blue) und gegen den Weltmeister im Go-Spiel im Jahre 2016 (IBM Watson).

Im Kleinen lĂ€sst sich das am Bauernschach bzw. dem Spiel „Schlag das Krokodil“ nachvollziehen. Die Spielregeln stammen vom richtigen Schachspiel: Die Bauernfigur kann geradeaus auf das vor ihr liegende Feld ziehen, wenn dieses frei ist, oder diagonal nach vorne, um einen gegnerischen Bauern zu schlagen. Gewonnen hat die/der SpielerIn, die/der es schafft, die eigene Spielfigur an das andere Ende des Spielfeldes zu fĂŒhren, oder alle gegnerischen Figuren geschlagen hat oder erreicht, dass der Gegner in der nĂ€chsten Runde keinen Spielzug mehr ausfĂŒhren kann.

Demonstrieren Sie zunĂ€chst die Funktionsweise der Website https://www.stefanseegerer.de/schlag-das-krokodil und erklĂ€ren Sie die Spielregeln. DarĂŒber hinaus ist es wichtig, dass die SuS die Bedeutung der farbigen Punkte verstehen (entsprechen der gleichfarbigen Aktion) und sehen, dass diese Punkte entfernt oder hinzugefĂŒgt werden können.

Bevor eine neue Runde gespielt wird, passt der Computer seine Strategie wie folgt an:

  • Computer hat gewonnen: Ein Token in der Farbe des letzten, siegbringenden Spielzugs wird zusĂ€tzlich auf das Feld dieses Spielzugs gelegt.

  • Mensch hat gewonnen: Das Token, das den letzten Zug der Computer-Spielerin bzw. des Computer-Spielers bestimmt hat, wird entfernt.

Lassen Sie die SuS nun einige Runden allein spielen. Ziel ist es, so oft wie möglich zu gewinnen, bevor die KI nicht mehr geschlagen werden kann. Dies scheint eine einfache Aufgabe zu sein, aber bald werden die SuS erkennen, dass sie ein gutes VerstĂ€ndnis des Innenlebens benötigen, um ĂŒber 10 oder sogar ĂŒber 20 Siege zu erzielen. Achtung, wenn die Seite neu geladen wird, werden auch die Gewinne zurĂŒckgesetzt!

Reflexion: Die SuS werden erkennen, dass sie zu Beginn noch oft gewinnen. Nach einigen Runden wird der Computer jedoch immer besser, da durch bestĂ€rkendes Lernen nur die SpielzĂŒge ĂŒbrigbleiben, die zu einem Gewinn fĂŒhren. Schlussendlich werden die SuS nicht mehr gegen den Computer gewinnen können. Sie sollten erkennen, dass sie gezielt ZĂŒge machen mĂŒssen, die sie zuvor noch nicht verwendet haben, um die KI in unbekanntes Gebiet zu „zwingen“. Es ist auch gut ersichtlich, dass die Anzahl der möglichen ZustĂ€nde mit der Anzahl der verfĂŒgbaren Aktionen recht schnell zunimmt. Man kann sich leicht vorstellen, dass es auf einem grĂ¶ĂŸeren Brett (wie z.B. einem Schachbrett) so viele mögliche ZustĂ€nde gibt, dass es nicht möglich ist, eine KI von Hand zu trainieren oder sogar generell alle möglichen ZustĂ€nde einzubeziehen. Wichtig ist auch die QualitĂ€t des menschlichen Spielers: Verliert die Maschine nicht, entwickelt sie sich auch nicht weiter. Verliert sie aber, wird jeweils der letzte Zug, der in direkter Folge zum Verlieren gefĂŒhrt hat, eliminiert, d. h. aus der ErgebnisĂŒbersicht gestrichen. Dies stellt eine negative BestĂ€rkung (BestĂ€rkung erfolgreicher Handlung findet hier nicht statt) dar, da der Zug in Zukunft mit Sicherheit nicht mehr angewendet wird. Die Maschine lernt auf diese Weise besser zu spielen.

Zur Vertiefung siehe auch https://computingeducation.de/proj-schlag-das-kroko/.

15

Aufgabe

Beschreibe nun, was du beobachtet hast:

  1. Wie sind die Spielrunden verlaufen?

  2. Wie hat der Computer gelernt?

  3. Mit welcher Strategie gelingt es, das Krokodil lÀnger zu besiegen?

16

Nachdem wir nun einen Einblick bekommen haben, wie kĂŒnstliche Intelligenz lernen kann, wollen wir uns nun dem widmen, was mit ihr möglich ist. Gemeinsam mit Nele und Emma schauen wir auf die Entwicklung von KI – von ihren AnfĂ€ngen bis hin zu Zukunftsaussichten.