Historisch? DeepMinds AlphaZero AI zeigt eine menschenähnliche Intuition

Das AlphaZero-Team bei der Arbeit Credit: DeepMind
Bitte teilen Sie diese Geschichte!
Diesmal ist es nur ein Schachspiel, aber wollen wir im wirklichen Leben wirklich eine KI, die "ihre Soldaten bereitwillig für eine bessere Position im Gefecht opfert ... und den einzelnen Figuren weit weniger Wert beimisst"? Intuition ist ein Merkmal der menschlichen Seele, das die inerte KI niemals duplizieren kann. ⁃ TN Editor

Das künstliche Intelligenzprogramm AlphaZero von DeepMind zeigt nun Anzeichen menschlicher Intuition und Kreativität, was die Entwickler als "Wendepunkt" in der Geschichte bezeichnet haben.

Das Computersystem Erstaunt die Welt im letzten Jahr als es das Schachspiel innerhalb von nur vier Stunden von Grund auf beherrschte, obwohl es nicht programmiert war, wie man gewinnt.

Aber jetzt, nach einem Jahr des Testens und Analysierens durch Schachgroßmeister, hat die Maschine einen neuen Spielstil entwickelt, wie er noch nie zuvor gesehen wurde, was darauf hindeutet, dass das Programm jetzt wie ein Mensch improvisiert.

Im Gegensatz zur weltbesten Schachmaschine - Stockfish -, die während des Spiels Millionen möglicher Ergebnisse berechnet, lernt AlphaZero aus den Erfolgen und Misserfolgen der Vergangenheit und macht seine Bewegungen auf der Grundlage eines nebulösen Gefühls, dass alles auf lange Sicht funktionieren wird , 'nach Experten bei DeepMind.

Als AlphaZero in 1,000-Spielen gegen Stockfish antrat, verlor es nur sechs, gewann überzeugend die 155-Zeiten und zog die verbleibenden Kämpfe nach sich.

Aber es war die Art und Weise, wie es gespielt wurde, die Entwickler erstaunt hat. Während sich Schachcomputer vorwiegend an ihren Figuren festhalten, opferte AlphaZero seine Soldaten bereitwillig für eine bessere Position im Gefecht.

In einem Gespräch mit The Telegraph sagte Prof. David Silver, Leiter der Forschungsgruppe für Verstärkungslernen bei DeepMind: „Es hat ein sehr subtiles Gespür für Intuition, das dabei hilft, die verschiedenen Faktoren auszugleichen.

„Es hat ein neuronales Netzwerk mit Millionen verschiedener einstellbarer Parameter, von denen jeder seine eigenen Regeln für das Gute im Schach lernt. Wenn Sie alle zusammenfügen, haben Sie etwas, das unsere menschliche Fähigkeit, auf eine hirnähnliche Weise auszudrücken, zum Ausdruck bringt Schauen Sie sich eine Position an und sagen Sie: "Ah ha, das ist das Richtige."

„Mein persönlicher Glaube ist, dass wir einen Wendepunkt gesehen haben, an dem wir zu verstehen beginnen, dass viele Fähigkeiten, wie Intuition und Kreativität, von denen wir bisher dachten, dass sie nur im Bereich des menschlichen Geistes liegen, tatsächlich für die maschinelle Intelligenz zugänglich sind auch. Und ich denke, das ist ein wirklich aufregender Moment in der Geschichte. “

AlphaZero startete als 'tabula rasa' oder Blanko-Schiefersystem, das nur mit den Grundregeln des Schachspiels programmiert wurde und durch das Spielen von Millionen von Spielen gegen sich selbst in einem Prozess des Versuchs und Irrtums, bekannt als "Reinforcement Learning", zu gewinnen lernte.

Genauso lernt das menschliche Gehirn, indem es die Taktik basierend auf einem vorherigen Gewinn oder Verlust anpasst, wodurch es nur 60 Tausend Positionen pro Sekunde sucht, verglichen mit den ungefähr 60 Millionen Stockfischen.

Innerhalb weniger Stunden hatte das Programm gemeinsame menschliche Eröffnungen und Strategien entdeckt und gespielt, bevor es seine eigenen Ideen entwickelte, wie z. B. schnell um den König des Gegners zu schwärmen und einzelnen Stücken weitaus weniger Wert beizumessen.

Der neue Spielstil wurde von Schachgroßmeister Matthew Sadler und der internationalen Frauenmeisterin Natasha Regan analysiert, die es anders als jede herkömmliche Schachmaschine sagen.

"Es ist, als würde man die geheimen Hefte eines großartigen Spielers aus der Vergangenheit entdecken", sagte Sadler.

Regan fügte hinzu: „Es war faszinierend zu sehen, wie sich die Analyse von AlphaZero von der der Top-Schach-Engines und sogar des Top-Grandmaster-Spiels unterschied. AlphaZero könnte ein leistungsfähiges Lehrmittel für die gesamte Community sein. “

Garry Kasparov, ehemaliger Schachweltmeister, der in 1997 berühmtermaßen gegen die Schachmaschine Deep Blue verloren hat, sagte: „Anstatt menschliche Anweisungen und Kenntnisse mit enormer Geschwindigkeit zu verarbeiten, generiert AlphaZero wie alle vorherigen Schachmaschinen sein eigenes Wissen.

"Es spielt mit einem sehr dynamischen Stil, ähnlich wie mein eigener. Die Auswirkungen gehen weit über mein geliebtes Schachbrett hinaus."

Lesen Sie die ganze Geschichte hier…

Abonnieren
Benachrichtigung von
Gast

0 Kommentare
Inline-Feedbacks
Alle Kommentare anzeigen