Los investigadores del MIT han
desarrollado un nuevo método de encriptación para trabajar con redes neuronales en la nube: Gazelle. El servidor procesa los datos del usuario sin conocer su contenido, es decir, permanecen anónimos. Hablamos sobre el sistema y sus perspectivas.
/ foto de John Jones CC¿Por qué necesitabas a Gazelle?
El outsourcing de aprendizaje automático es una tendencia creciente en la industria de TI. Las grandes empresas lanzan plataformas en la nube con redes neuronales convolucionales. Estas redes se utilizan a menudo para clasificar imágenes (en medicina, por ejemplo, para clasificar imágenes de rayos X y TC). Sin embargo, sus mecanismos para intercambiar datos a través de la red ralentizan seriamente todo el proceso, lo que limita el rango de aplicaciones de dichos servicios.
Gazelle protegerá los datos que se transmiten a las redes neuronales en la nube y acelerará su procesamiento. La solución MIT es 20-30 veces más rápida que
algoritmos similares .
¿Cómo funciona la tecnología?
El sistema usa dos formas de encriptación. El primero es el
cifrado homomórfico : le permite realizar varias operaciones matemáticas en los datos cifrados del usuario y generar un resultado cifrado. Además, corresponde al resultado de operaciones realizadas con valores "abiertos".
La segunda forma es un protocolo de
bucle distorsionado . Este es
un protocolo de cálculo confidencial que permite a los participantes en el sistema evaluar un valor (por ejemplo, más, menos o igual) sin revelar información sobre los datos de entrada y sin involucrar a un tercero (árbitro).
En general, el sistema consta de tres componentes. La primera es una capa homomórfica (Capa homomórfica), que contiene implementaciones rápidas de operaciones homomórficas: adición SIMD y multiplicación SIMD (escalar), así como
automorfismos . El segundo componente son los núcleos de álgebra lineal (núcleos de álgebra lineal). Los algoritmos para la multiplicación de matriz-vector y la convolución homomórfica, así como un sistema para buscar signos de imágenes, están "encerrados" aquí.
El tercer componente se llama Gazelle Network Inference. Este es un sistema de inferencia que combina sistemas de bucles distorsionados con núcleos de álgebra lineal. Representa la base del protocolo para generar los resultados del procesamiento de una red neuronal.
El procesamiento de datos en sí es el siguiente. Primero, el cliente cifra sus datos utilizando un esquema de cifrado homomórfico y los envía a un servidor con una red neuronal. Además, la red neuronal realiza los cálculos necesarios en la capa lineal y luego los transfiere a la capa no lineal (en redes neuronales convolucionales, estas capas se alternan constantemente).
Después de eso, los datos se comparten entre la red y el dispositivo del usuario. El dispositivo de este último debe tener un sistema que pueda funcionar con circuitos basados en la construcción de circuitos distorsionados. El usuario realiza de forma independiente una serie de cálculos y envía los resultados cifrados a la nube.
Esta carga compartida asegura que el sistema neurológico realizará cálculos homomórficos complejos para una capa a la vez. Esto evita el ruido de datos y mejora el rendimiento del sistema (ya que un circuito distorsionado funciona mejor en capas no lineales). Se realiza un intercambio de datos similar alternativamente para todas las capas de la red.
A continuación, el procedimiento para compartir secretos. Los datos, divididos en varias partes, se sincronizan y se recopilan juntos en el cliente. El servicio en la nube envía la última clave para descifrar el resultado. Entonces, un lado (usuario) recibe los resultados de clasificación, y el otro lado (servidor con una red neuronal) no recibe nada.
Puede obtener más información sobre el sistema en un
artículo publicado por investigadores en función de los resultados de su trabajo.
Perspectiva tecnológica
Hasta ahora, el algoritmo es experimental y no se ha implementado en ninguna aplicación en particular. Crear programas con aplicación práctica es la siguiente etapa en el desarrollo del sistema.
/ foto PxHere PDQuizás uno de los casos de usuario será el algoritmo de aprendizaje automático, que revela la presencia de retinopatía diabética en pacientes con una imagen ocular. El sistema ya ha sido
aprobado por la Administración de Drogas y Alimentos de los Estados Unidos y se está utilizando en hospitales. Es probable que sea el primero para el que se implementa Gazelle.
Planean usar tecnología no solo en el campo de la medicina. También encontrará aplicación en sistemas analíticos para el mercado financiero y sistemas de reconocimiento facial. Por lo tanto, el servidor no tendrá acceso a las fotos originales de las personas, lo que debería aumentar la seguridad de estas soluciones.
PD: ¿Qué más estamos escribiendo en el blog de IaaS:
Publicaciones de PPS Fresh de nuestro blog sobre Habré: