Schon mal was von "Deepfakes" gehört? KI, die das Gesicht einer Person auf den Körper einer anderen Person legt, wurde verwendet, um Harrison Ford in unzähligen Videoclips durch Nicholas Cage zu ersetzen, sowie für abscheulichere Zwecke: Prominente traten ohne ihr Wissen in Pornos und Propaganda auf. Forscher der Carnegie Mellon University haben nun ein neues, leistungsfähigeres und vielseitigeres System entwickelt.
Es heißt "Recycle-GAN". Dies ist ein System zum Transformieren des Inhalts eines Videos oder Fotos in die Ähnlichkeit eines anderen, wobei ausschließlich aus nicht zugewiesenen Eingabedaten gelernt wird (Training ohne Lehrer). "Die Aufgabe, Inhalte zu ändern und dabei den Stil des Originals beizubehalten, hat viele Verwendungszwecke, z. B. das Anwenden von Bewegungen und Gesichtsausdrücken einer Person auf eine andere, das Trainieren von Robotern nach der" Do as I "-Methode oder das Konvertieren von Schwarzweißvideos in Farbvideos."
Bis jetzt waren selbst die fortschrittlichsten Transformationsmethoden auf menschliche Gesichter ausgerichtet, und laut Forschern „war es praktisch unmöglich, sie in anderen Bereichen anzuwenden“, zusätzlich zu „sie arbeiten sehr schlecht mit teilweise verborgenen Gesichtern“. Andere Methoden verwenden eine Frame-für-Frame-Transformation, die eine mühsame manuelle Kennzeichnung und Datenausrichtung erfordert.

Recycle-GAN verwendet generative gegnerische Netzwerke (GANs) und Raum-Zeit-Markierungen, um zwei Bilder oder Videos zu „verknüpfen“. (GANs sind Modelle, die aus einem Generator bestehen, der versucht, den Diskriminator zu „täuschen“, indem er aus den Eingabedaten immer realistischere Ergebnisse liefert.) Wenn Sie mit Personen auf Video trainieren, erstellen sie Videos mit schwer fassbaren Momenten wie Grübchen auf den Wangen, die sich beim Lächeln bilden und Lippenbewegung.
„Ohne Intervention und Grundkenntnisse in Bezug auf die Besonderheiten des Videos kann unser Ansatz einfach mithilfe öffentlich zugänglicher Themenvideos aus dem Internet lernen“, schreibt das Entwicklungsteam
Recycle-GAN kann viel mehr als nur Gesichtsausdrücke übertragen. Die Forscher verwendeten es, um die Wetterbedingungen in einem Video zu ändern, indem sie an einem windigen Tag die volle Ruhe umwandelten. Sie ahmten blühende und sterbende Blumen nach und synthetisierten einen überzeugenden Sonnenaufgang aus einem Video im Internet.
Die Testergebnisse sind recht gut: Das System hat es geschafft, in 28,3% der Fälle 15 Probanden auszutricksen. Das Team ist jedoch der Ansicht, dass die Produkte zukünftiger Versionen des Systems glaubwürdiger sein können, wenn sie die Wiedergabegeschwindigkeit berücksichtigen, z. B. wie viel schneller oder langsamer die Leute im Video sagen
"Eine plausible Stilübertragung sollte in der Lage sein, auch den Zeitunterschied zu berücksichtigen, der sich aus der Wiedergabe von Sprache / Inhalten ergibt", schrieb das Team. "Wir glauben, dass die beste räumlich-zeitliche Architektur eines neuronalen Netzwerks dieses Problem in naher Zukunft lösen kann."
Es überrascht nicht, dass Deepfakes ein heiß diskutiertes heißes Thema bleiben. Öffentlich zugängliche Dienste machen ihre Erstellung relativ einfach, und es gibt keine Rechtsgrundlage für den Schutz der Opfer solcher Videos.
Reddit, Pornhub, Twitter und andere haben sich gegen sie ausgesprochen, und Forscher (zuletzt Mitglied des US-Verteidigungsministeriums) suchen weiterhin nach Möglichkeiten, um Deepfakes zu erkennen. Eric Goldman, Professor für Rechtswissenschaften an der Universität von Santa Clara und Direktor des Instituts für Hochtechnologie, sagte kürzlich, es sei am besten, sich darauf vorzubereiten, in einer Welt zu leben, in der sowohl echte als auch gefälschte Fotos und Videos uns umgeben.