Die DeepMind-Abteilung von Google, die an der Entwicklung superintelligenter Computer arbeitet, hat ein System für maschinell erzeugte Sprache entwickelt, das die vorhandene Technologie um 50 Prozent übertrifft.
Das britische Unternehmen DeepMind, das Google für etwa 400 Millionen Pfund (533 Millionen US-Dollar) in 2014 erworben hat, entwickelte eine künstliche Intelligenz namens WaveNet, die die menschliche Sprache nachahmen kann, indem es lernt, wie man die einzelnen Schallwellen bildet, die eine menschliche Stimme erzeugt Blogbeitrag Freitag. In Blindtests für US-Englisch und Mandarin-Chinesisch stellten menschliche Zuhörer fest, dass die von WaveNet erzeugte Sprache natürlicher klang als die, die mit den vorhandenen Text-to-Speech-Programmen von Google erstellt wurde, die auf verschiedenen Technologien basieren. WaveNet übertraf die Aufzeichnungen der tatsächlichen menschlichen Sprache immer noch.
Viele computergenerierte Sprachprogramme verwenden einen großen Datensatz mit kurzen Aufzeichnungen eines einzelnen menschlichen Sprechers und kombinieren diese Sprachfragmente, um neue Wörter zu bilden. Das Ergebnis ist verständlich und klingt menschlich, wenn auch nicht ganz natürlich. Der Nachteil ist, dass der Klang der Stimme nicht einfach geändert werden kann. Andere Systeme bilden die Stimme vollständig elektronisch, in der Regel basierend auf Regeln, wie bestimmte Buchstabenkombinationen ausgesprochen werden. Mit diesen Systemen kann der Ton der Stimme leicht manipuliert werden, sie klingen jedoch weniger natürlich als computergenerierte Sprache, die auf Aufzeichnungen von menschlichen Lautsprechern basiert, so DeepMind.
WaveNet ist eine Art von KI, die als neuronales Netzwerk bezeichnet wird und die nachahmt, wie Teile des menschlichen Gehirns funktionieren. Solche Netzwerke müssen mit großen Datenmengen trainiert werden.
Pat nagelt Situation mit seinem Kommentar noch einmal.