Künstliche Intelligenz schaffen: DeepMinds AlphaZero

11. Mai 1997, ein besonderer Tag für künstliche Intelligenz. An diesem Tag konnte ein Computerprogramm namens Deep Blue erstmals einen amtierenden Schachweltmeister unter Turnierbedingungen besiegen.

In der KI hat sich seitdem einiges geändert, und zwar auf eine gute Art und Weise. In den letzten Jahren wurden massive Fortschritte und Durchbrüche in der KI-Forschung erzielt. Maschinen werden intelligenter und vor allem gewinnen wir durch all diese Forschungen ein klareres Verständnis dafür, was menschliche Intelligenz wirklich ist. Nur mit einem konkreten Verständnis von Intelligenz können wir intelligente Maschinen bauen.

DeepMind war an der Spitze der KI-Revolution.

DeepMind

DeepMind Technologies ist ein britisches Unternehmen für künstliche Intelligenz. 2014 wurden sie von Google für ihr weltweit führendes Know-how im Bereich KI gekauft. Seit ihrer Gründung haben sie die weltweit ehrgeizigsten Schritte unternommen, um KI zu lösen.

Ihre neueste Kreation ist auch ihre beeindruckendste: AlphaZero

AlphaZero ist ein KI-System, das sich selbst beigebracht hat, wie man Schach, Shogi (japanisches Schach) und Go beherrscht. Um die Exzellenz von AlphaZero zu beweisen, wurde es in jedem Spiel mit einem Weltmeister verglichen. AlphaZero ging als Sieger hervor.

Spiele und Intelligenz

Bei der Suche nach intelligenten Maschinen mussten die Forscher zunächst beantworten, was Intelligenz eigentlich ist. Es ist keine so einfache Frage zu beantworten!

An was denkst du, wenn jemand dich bittet, Intelligenz zu definieren? Man könnte sich jemanden vorstellen, den sie für schlau halten. Sie wissen Dinge, die andere nicht wissen. Darüber hinaus können sie dieses Wissen in Form von Fähigkeiten einsetzen, um ein Ziel zu erreichen.

Das Ziel ist in der Regel etwas schwierig zu erreichen. Es sollte etwas spezielles Wissen, Können oder tieferes Verständnis erfordern: Intelligenz.

Die Fähigkeit, ein Spiel zu spielen und zu gewinnen, ist eine Form von Intelligenz. Spiele haben Regeln und Ziele. Alle Spieler spielen nach den gleichen Regeln und versuchen, dasselbe zu erreichen: das Spiel zu gewinnen. Um zu gewinnen, muss man wissen, wie man das Spiel spielt und wie man dieses Wissen nutzt, um seinen Gegner zu besiegen.

Diese Forderung nach hochspezialisiertem und fortgeschrittenem Wissen, um zu gewinnen, ist genau der Grund, warum Brettspiele seit langem als Prüfstand für KI-Systeme eingesetzt werden. Wenn wir wollen, dass unser System eine Partie Schach nicht nur gegen einen Amateur, sondern auch gegen den Weltbesten, einen Großmeister, gewinnen kann, dann weiß dieses System besser viel über Schach! Es muss viele Züge vorausschauen, die Brettpositionen und die Vorteile jedes Spielers verstehen und ein tieferes Verständnis und eine tiefere Intuition für das Spiel selbst haben als sein Gegner. Es muss intelligent sein.

Kasparov gegen Deep Blue (links) und Sedol gegen AlphaGo (rechts)Schach und los

Schach war bis kurz nach dem Sieg über Gary Kasparov das wichtigste Lernspiel für AI. Schach-Engines, Computerprogramme, die wirklich gut im Schach sind, wurden einige Jahre später populär und sind jetzt auf so ziemlich jedem Computer- und Telefonschachspiel zu finden, das Sie finden können! Während KI-Systeme aus Gründen der Gründlichkeit noch als Benchmark für das Schachspiel herangezogen werden, haben Forscher Systeme entwickelt, die bei anspruchsvolleren Spielen gewinnen können: Go.

Go ist ein weiteres Strategiespiel, bei dem es darum geht, mehr Territorium als der Gegner zu umrunden. Es klingt einfach, aber die Tiefe des Denkens ist wohl weit mehr als die des Schachs. Um den Unterschied in der Komplexität einfach zu vergleichen, wird Schach auf einem 8x8-Brett mit 64 Feldern gespielt, während Go auf einem 19x19-Gitter mit 361 Schnittpunkten gespielt wird (Punkte, an denen Sie spielen können)! Die Anzahl der möglichen Züge in Go ist viel höher als die in Schach.

Diese enorme Komplexität ist der Grund, warum sich Forscher dafür entscheiden, nach dem Go-Spiel voranzukommen. Wenn ein KI-System gebaut werden kann, um einen Weltmeister in einem so komplexen Spiel wie Go zu besiegen, muss es eine Form von Intelligenz haben. Zumindest kann es uns Hinweise geben, woher die Argumentation und die Intuition kommen, die die Intelligenz benötigt.

AlphaZero: Eine intelligente Maschine

In der Vergangenheit wurden KI-Systeme für ein bestimmtes Spiel entwickelt, sodass Sie nicht dasselbe KI-System verwenden können, das Sie für das Go-Spiel für Schach entwickelt haben. Aber AlphaZero ist kein Trickpony! AlphaZero ist ein generisches KI-System, das theoretisch lernen kann, in mehreren Spielen professionell zu spielen und zu gewinnen. Bisher hat es sich in den Partien Schach, Shogi und Go mit demselben Algorithmus bewährt.

Darstellung von AlphaZero AI mit freundlicher Genehmigung von DeepMind

Der aufregendste Durchbruch, den AlphaZero geschafft hat, ist das unglaubliche Lernen im Selbstspiel. Sie sehen, um die Partien Schach, Shogi und Go zu üben, hat AlphaZero nicht gegen menschliche Gegner gespielt. Es lernte all seine Fähigkeiten, indem es gegen sich selbst spielte, ohne über die Grundregeln des Spiels Bescheid zu wissen.

Damit AlphaZero jedes Spiel lernen kann, spielt ein neuronales Netzwerk Millionen von Spielen gegen sich selbst. Da es zunächst ohne Wissen darüber beginnt, was gutes Spiel und Strategie sind, durchläuft es zunächst eine ziemlich zufällige Versuchs- und Irrtumsphase. Aber im weiteren Spielverlauf zwingt der Prozess des Erhöhens des Lernens das System dazu, mehr „positive“ Züge zu spielen und die „negativen“ zu vermeiden.

Das verstärkende Lernen von KI basiert auf einem Belohnungssystem. Die KI erhält eine positive Belohnung für den Gewinn des Spiels und eine negative für den Verlust. Mit der Zeit lernt das System, seine Punktzahl zu maximieren.

Bei der Beobachtung der Spiele, die Alpha Zero einmal absolviert hatte, stellten Weltmeister aller Spiele fest, dass AlphaZero die konventionellen Strategien der von den Großmeistern häufig gespielten Spiele erfolgreich gelernt hatte. Zum Beispiel spielte AlphaZero häufig die gängigsten Eröffnungsstrategien und zeigte erfahrene Fähigkeiten in der Verteidigung seines Königs wie ein Profi.

Aber das wirklich Besondere an Alpha Zero war nicht, dass es gelernt hat, was andere Champions wussten, sondern dass es gelernt hat, was sie nicht wussten. Alpha Zero war nicht nur darauf beschränkt, gegen das zu spielen, woran ein Mensch denken konnte. Es hatte die Flexibilität, jeden einzelnen möglichen Zug zu spielen und sein Lernen für unkonventionelle Spiele und Strategien zu öffnen, die es noch nie zuvor gesehen hatte.

„Einige seiner Bewegungen, wie beispielsweise die Bewegung des Königs in die Mitte des Spielfelds, widersprechen der Shogi-Theorie und scheinen AlphaZero aus menschlicher Sicht in eine gefährliche Position zu bringen. Unglaublicherweise behält es die Kontrolle über das Board. Sein einzigartiger Spielstil zeigt uns, dass es neue Möglichkeiten für das Spiel gibt. “
- Yoshiharu Habu, 9-jähriger Profi, der als einziger Spieler in der Geschichte alle sieben großen Shogi-Titel gewonnen hat

Solche Fähigkeiten werden von Experten als kreativ angesehen, was ein übermenschliches Maß an Wissen und Können erfordern würde: Intelligenz. Um intelligente Systeme zu schaffen, die in der Lage sind, eine Vielzahl realer Probleme zu lösen, müssen sie so konzipiert sein, dass sie die Regeln gut verstehen, aber auch flexibel genug sind, um ihre eigenen Erkundungen vorzunehmen. Sie müssen auch in der Lage sein, sich mit vielen verschiedenen Dingen vertraut zu machen und nicht an ein einziges Spiel gebunden zu sein.

AlphaZero zeigt einige frühe Anzeichen dafür. Es zeigt, dass ein einziger Algorithmus lernen kann, das aktuelle Wissen zu verstehen und darüber hinauszugehen. Dies ist ein Schritt in die richtige Richtung, um Intelligenz zu schaffen.

Wenn Sie mehr über AlphaZero erfahren möchten, können Sie den Blogbeitrag von DeepMind oder das im Science Journal veröffentlichte Forschungspapier lesen.

Möchten Sie lernen?

Folgen Sie mir auf Twitter, wo ich alles über die neueste und beste KI, Technologie und Wissenschaft veröffentliche!