So schützen Sie Daten in neuronalen Cloud-Netzen - eine neue Verschlüsselungsmethode wird vorgeschlagen

Forscher am MIT haben eine neue Verschlüsselungsmethode für die Arbeit mit neuronalen Netzen in der Cloud entwickelt - Gazelle. Der Server verarbeitet die Benutzerdaten, ohne deren Inhalt zu kennen, dh sie bleiben anonym. Wir sprechen über das System und seine Perspektiven.


/ Foto von John Jones CC

Warum brauchst du Gazelle?


Das Outsourcing von maschinellem Lernen ist ein wachsender Trend in der IT-Branche. Große Unternehmen starten Cloud-Plattformen mit Faltungs-Neuronalen Netzen. Diese Netzwerke werden häufig zur Klassifizierung von Bildern verwendet (in der Medizin beispielsweise zur Klassifizierung von Röntgen- und CT-Bildern). Ihre Datenaustauschmechanismen über das Netzwerk verlangsamen jedoch den gesamten Prozess erheblich, was den Anwendungsbereich solcher Dienste einschränkt.

Gazelle schützt Daten, die an neuronale Netze in der Cloud übertragen werden, und beschleunigt deren Verarbeitung. Die MIT-Lösung ist 20 bis 30 Mal schneller als ähnliche Algorithmen .

Wie Technologie funktioniert


Das System verwendet zwei Arten der Verschlüsselung. Die erste ist die homomorphe Verschlüsselung. Sie ermöglicht es Ihnen, verschiedene mathematische Operationen an den verschlüsselten Benutzerdaten durchzuführen und ein verschlüsseltes Ergebnis zu generieren. Darüber hinaus entspricht es dem Ergebnis von Operationen, die mit "offenen" Werten ausgeführt wurden.

Die zweite Form ist ein verzerrtes Schleifenprotokoll . Dies ist ein vertrauliches Berechnungsprotokoll , mit dem Teilnehmer des Systems einen Wert (z. B. mehr, weniger oder gleich) bewerten können, ohne Informationen über die Eingabedaten preiszugeben und ohne einen Dritten (Schiedsrichter) einzubeziehen.

Im Allgemeinen besteht das System aus drei Komponenten. Die erste ist eine homomorphe Schicht (Homomorphic Layer), die schnelle Implementierungen homomorpher Operationen enthält: SIMD-Addition und SIMD-Multiplikation (Skalar) sowie Automorphismen . Die zweite Komponente sind die linearen Algebra-Kernel (Linear Algebra-Kernel). Algorithmen zur Matrix-Vektor-Multiplikation und homomorphen Faltung sowie ein System zur Suche nach Zeichen von Bildern sind hier „eingeschlossen“.

Die dritte Komponente heißt Gazelle Network Inference. Dies ist ein Inferenzsystem, das verzerrte Schleifensysteme mit Kerneln der linearen Algebra kombiniert. Es stellt die Grundlage des Protokolls zur Ausgabe der Ergebnisse der Verarbeitung eines neuronalen Netzwerks dar.

Die Datenverarbeitung selbst ist wie folgt. Zunächst verschlüsselt der Client seine Daten mithilfe eines Schemas für die homomorphe Verschlüsselung und sendet sie an einen Server mit einem neuronalen Netzwerk. Ferner führt das neuronale Netzwerk die erforderlichen Berechnungen in der linearen Schicht durch und überträgt sie dann weiter auf die nichtlineare Schicht (in Faltungs-neuronalen Netzen wechseln sich diese Schichten ständig ab).

Danach werden die Daten zwischen dem Netzwerk und dem Gerät des Benutzers geteilt. Das Gerät des letzteren sollte ein System haben, das in der Lage ist, mit Schaltkreisen zu arbeiten, die auf dem Aufbau verzerrter Schaltkreise basieren. Der Benutzer führt unabhängig eine Reihe von Berechnungen durch und sendet die verschlüsselten Ergebnisse zurück an die Cloud.

Diese Lastverteilung stellt sicher, dass das Neurosystem komplexe homomorphe Berechnungen für jeweils eine Schicht durchführt. Dies vermeidet Datenrauschen und verbessert die Systemleistung (da eine verzerrte Schaltung auf nichtlinearen Schichten am besten funktioniert). Ein ähnlicher Datenaustausch wird abwechselnd für alle Schichten des Netzwerks durchgeführt.

Als nächstes das Verfahren zum Teilen von Geheimnissen. Die in mehrere Teile unterteilten Daten werden synchronisiert und beim Kunden zusammen gesammelt. Der Cloud-Dienst sendet den letzten Schlüssel, um das Ergebnis zu entschlüsseln. Eine Seite (Benutzer) erhält also die Klassifizierungsergebnisse, und die andere Seite (Server mit einem neuronalen Netzwerk) erhält nichts.

Weitere Informationen zum System finden Sie in einem Artikel, der von Forschern anhand der Ergebnisse ihrer Arbeit veröffentlicht wurde.

Technologie-Ausblick


Bisher ist der Algorithmus experimentell und wurde in keiner bestimmten Anwendung implementiert. Das Erstellen von Programmen mit praktischer Anwendung ist der nächste Schritt in der Entwicklung des Systems.


/ Foto PxHere PD

Möglicherweise ist einer der Anwenderfälle der Algorithmus für maschinelles Lernen, der das Vorhandensein einer diabetischen Retinopathie bei Patienten mit einem Augenbild aufzeigt. Das System wurde bereits von der US-amerikanischen Food and Drug Administration zugelassen und wird in Krankenhäusern eingesetzt. Es ist wahrscheinlich, dass es das erste sein wird, für das Gazelle implementiert wird.

Sie planen, Technologie nicht nur im Bereich der Medizin einzusetzen. Es wird auch Anwendung in Analysesystemen für den Finanzmarkt und Gesichtserkennungssystemen finden. Der Server hat also keinen Zugriff auf die Originalfotos von Personen, was die Sicherheit dieser Lösungen erhöhen sollte.



PS Was schreiben wir noch auf dem IaaS-Blog:


PPS Neue Beiträge aus unserem Blog auf Habré:

Source: https://habr.com/ru/post/de422309/


All Articles