Pesquisadores do MIT
desenvolveram um novo método de criptografia para trabalhar com redes neurais na nuvem - o Gazelle. O servidor processa os dados do usuário sem conhecer seu conteúdo, ou seja, eles permanecem anônimos. Falamos sobre o sistema e suas perspectivas.
/ foto de John Jones CCPor que você precisou da Gazelle
A terceirização de aprendizado de máquina é uma tendência crescente no setor de TI. Grandes empresas lançam plataformas em nuvem com redes neurais convolucionais. Essas redes são frequentemente usadas para classificar imagens (na medicina, por exemplo, para classificar imagens de raios-X e tomografia computadorizada). No entanto, seus mecanismos de troca de dados pela rede desaceleram seriamente todo o processo, o que limita a variedade de aplicativos desses serviços.
O Gazelle protegerá os dados transmitidos às redes neurais na nuvem e acelerará seu processamento. A solução MIT é 20 a 30 vezes mais rápida que
algoritmos semelhantes .
Como a tecnologia funciona
O sistema usa duas formas de criptografia. A primeira é a
criptografia homomórfica - permite executar várias operações matemáticas nos dados criptografados do usuário e gerar um resultado criptografado. Além disso, corresponde ao resultado de operações realizadas com valores "abertos".
A segunda forma é um protocolo de
loop distorcido . Este é
um protocolo de cálculo confidencial que permite que os participantes no sistema avaliem um valor (por exemplo, mais, menor ou igual) sem divulgar informações sobre os dados de entrada e sem envolver terceiros (árbitro).
Em geral, o sistema consiste em três componentes. A primeira é uma camada homomórfica (Camada Homomórfica), que contém implementações rápidas de operações homomórficas: adição de SIMD e multiplicação de SIMD (escalar), além de
automorfismos . O segundo componente são os kernels de álgebra linear (kernels de álgebra linear). Algoritmos para multiplicação de vetores matriciais e convolução homomórfica, bem como um sistema para busca de sinais de imagens, são "anexados" aqui.
O terceiro componente é chamado de inferência da rede Gazelle. Este é um sistema de inferência que combina sistemas de loop distorcidos com núcleos de álgebra linear. Representa a base do protocolo para gerar os resultados do processamento de uma rede neural.
O processamento de dados em si é o seguinte. Primeiro, o cliente criptografa seus dados usando um esquema para criptografia homomórfica e os envia para um servidor com uma rede neural. Além disso, a rede neural realiza os cálculos necessários na camada linear e depois transfere-os para a camada não linear (em redes neurais convolucionais, essas camadas estão constantemente alternadas).
Depois disso, os dados são compartilhados entre a rede e o dispositivo do usuário. O dispositivo deste último deve ter um sistema capaz de trabalhar com circuitos baseados na construção de circuitos distorcidos. O usuário executa independentemente uma série de cálculos e envia os resultados criptografados de volta para a nuvem.
Esse compartilhamento de carga garante que o neurossistema realize cálculos homomórficos complexos para uma camada de cada vez. Isso evita o ruído dos dados e melhora o desempenho do sistema (já que um circuito distorcido funciona melhor em camadas não lineares). Uma troca de dados semelhante é realizada alternadamente para todas as camadas da rede.
Em seguida, o procedimento para compartilhar segredos. Os dados, divididos em várias partes, são sincronizados e coletados juntos no cliente. O serviço de nuvem envia a última chave para descriptografar o resultado. Portanto, um lado (usuário) recebe os resultados da classificação e o outro lado (servidor com uma rede neural) não recebe nada.
Você pode aprender mais sobre o sistema em um
artigo publicado por pesquisadores com base nos resultados de seus trabalhos.
Perspectivas tecnológicas
Até agora, o algoritmo é experimental e não foi implementado em nenhuma aplicação específica. Criar programas com aplicação prática é o próximo estágio no desenvolvimento do sistema.
/ foto PxHere PDTalvez um dos casos do usuário seja o algoritmo de aprendizado de máquina, que revela a presença de retinopatia diabética em pacientes com uma imagem ocular. O sistema já foi
aprovado pela Food and Drug Administration dos EUA e está sendo usado em hospitais. É provável que seja o primeiro para o qual o Gazelle seja implementado.
Eles planejam usar a tecnologia não apenas no campo da medicina. Também encontrará aplicação em sistemas analíticos para o mercado financeiro e sistemas de reconhecimento de face. Portanto, o servidor não terá acesso às fotos originais das pessoas, o que deve aumentar a segurança dessas soluções.
PS O que mais estamos escrevendo no blog IaaS:
PPS Fresh posts do nosso blog em Habré: