AI-Programm versteckte Daten von den Erstellern, um bei der festgelegten Aufgabe zu betrügen

Bitte teilen Sie diese Geschichte!
image_pdfimage_print
Ob beabsichtigt oder nicht, AI-Algorithmen erben die Vorurteile ihrer Schöpfer. Es ist absolut inakzeptabel, dass eine KI lernen könnte, diejenigen zu täuschen, denen sie dient. ⁃ TN Editor

Je nachdem, wie paranoid Sie sind, diese Forschung von Stanford und Google wird entweder erschreckend oder faszinierend sein. Es stellte sich heraus, dass ein Agent für maschinelles Lernen, der Luftbilder in Straßenkarten und zurückverwandeln soll, betrügt, indem er Informationen versteckt, die er später in einem „fast unmerklichen Hochfrequenzsignal“ benötigt. Cleveres Mädchen!

Dieses Ereignis zeigt ein Problem mit Computern auf, die seit ihrer Erfindung existieren: Sie tun genau das, was Sie ihnen sagen.

Die Absicht der Forscher war es, wie Sie sich vorstellen können, den Prozess der Umwandlung von Satellitenbildern in Googles bekanntermaßen genaue Karten zu beschleunigen und zu verbessern. Zu diesem Zweck arbeitete das Team mit dem sogenannten CycleGAN - einem neuronalen Netzwerk, das durch viel Experimentieren lernt, Bilder vom Typ X und Y so effizient und genau wie möglich ineinander umzuwandeln.

In einigen frühen Ergebnissen ging es dem Agenten gut - verdächtig Gut. Als der Agent Luftbilder von seinen Straßenkarten rekonstruierte, wies das Team darauf hin, dass es viele Details gab, die auf letzteren anscheinend überhaupt nicht zu finden waren. Zum Beispiel würden Oberlichter auf einem Dach, die beim Erstellen der Straßenkarte entfernt wurden, auf magische Weise wieder angezeigt, wenn sie den Agenten aufforderten, den umgekehrten Vorgang auszuführen:

Die Originalkarte, links; die Straßenkarte, die aus dem ursprünglichen Zentrum erstellt wurde; und die Luftbildkarte, die nur aus der Straßenkarte generiert wurde. Beachten Sie das Vorhandensein von Punkten auf beiden Luftbildkarten, die nicht auf der Straßenkarte dargestellt sind.

Obwohl es sehr schwierig ist, einen Blick in das Innenleben der Prozesse eines neuronalen Netzwerks zu werfen, konnte das Team die von ihm generierten Daten problemlos prüfen. Und mit ein wenig Experimentieren stellten sie fest, dass der CycleGAN tatsächlich einen schnellen gezogen hatte.

Der Agent sollte in der Lage sein, die Merkmale der beiden Kartentypen zu interpretieren und sie den richtigen Merkmalen der anderen zuzuordnen. Aber was war der Agent? berührt das SchneidwerkzeugUnter anderem wurde bewertet, wie nah eine Luftbildkarte am Original war und wie klar die Straßenkarte war.

So dass es nicht lerne, wie man eins von dem anderen macht. Es lernte, die Merkmale des einen subtil in die Rauschmuster des anderen zu codieren. Die Details der Luftbildkarte werden heimlich in die tatsächlichen visuellen Daten der Straßenkarte geschrieben: Tausende winziger Farbänderungen, die das menschliche Auge nicht bemerken würde, die der Computer jedoch leicht erkennen kann.

Tatsächlich ist der Computer so gut darin, diese Details in die Straßenkarten einzufügen, dass er gelernt hat, sie zu codieren jeglicher Luftbildkarte in jeglicherStraßenkarte! Es muss nicht einmal auf die „echte“ Straßenkarte geachtet werden - alle Daten, die für die Rekonstruktion des Luftbildes benötigt werden, können harmlos auf eine völlig andere Straßenkarte gelegt werden, wie die Forscher bestätigten:

Die Karte auf der rechten Seite wurde ohne wesentliche visuelle Änderungen in die Karte auf der linken Seite codiert. (Bilder: agsandrew / Shutterstock)

Die farbigen Karten in (c) sind eine Visualisierung der geringfügigen Unterschiede, die der Computer systematisch eingeführt hat. Sie können sehen, dass sie die allgemeine Form der Luftbildkarte bilden, aber Sie würden sie nie bemerken, wenn sie nicht sorgfältig hervorgehoben und so übertrieben wäre.

Diese Methode, Daten in Bilder zu kodieren, ist nicht neu. Es handelt sich um eine etablierte Wissenschaft namens Steganografie, die beispielsweise dazu verwendet wird, Bilder mit Wasserzeichen zu versehen oder Metadaten wie Kameraeinstellungen hinzuzufügen. Aber ein Computer, der seine eigene steganografische Methode entwickelt, um zu vermeiden, dass er tatsächlich lernen muss, die anstehende Aufgabe auszuführen is eher neu. (Nun, die Forschung kam letztes Jahr heraus, also ist es nicht so neu neu, aber es ist ziemlich neuartig.)

Lesen Sie die ganze Geschichte hier…

Treten Sie unserer Mailingliste bei!


Abonnieren
Benachrichtigung von
Gast
0 Kommentare
Inline-Feedbacks
Alle Kommentare anzeigen