O mais recente processador Eyeriss de 168 núcleos - uma rede neural em nosso smartphone
Bem-vindo aos nossos leitores nas páginas de blog do iCover ! Na Conferência Internacional de Circuitos de Estado Sólido (ISSCC-2016), realizada no início de fevereiro em São Francisco, uma equipe de desenvolvedores do MIT (Massachusetts Institute of Technology) demonstrou um protótipo funcional de um chip de nova geração Eyeriss, criado como uma solução conceitual que permite recriar os recursos dos algoritmos de redes neurais em uma ampla gama de dispositivos de baixa potência.
Uma das razões objetivas pelas quais as redes neurais artificiais não foram desenvolvidas adequadamente em nossos smartphones ou tablets é a falta de uma fonte de alimentação compacta de energia suficiente. De fato, os chamados sistemas de inteligência artificial tipo cérebro, tipo cérebro, pelo menos na forma em que são representados por tecnologias modernas, dependem em seu trabalho de poderosos processadores multicore que consomem uma quantidade incrível de energia em comparação com o nosso cérebro. De qualquer forma, até recentemente, não era possível imaginar essas soluções no nível de dispositivos de classe de usuário. Ao mesmo tempo, a idéia de "miniaturização" da inteligência artificial excita a mente dos desenvolvedores por um longo tempo e, como se vê, já traz resultados bastante tangíveis.As redes neurais têm sido o foco de atenção dos cientistas desde os primeiros dias do estudo da inteligência artificial, mas na década de 1970 elas foram esquecidas. Na última década, as tecnologias relacionadas ao uso das capacidades das redes neurais estão sendo estudadas no nível dos programas de "aprendizado profundo"."A aprendizagem profunda tem muitos usos, como reconhecimento de objeto, fala ou face", disseram Vivienne Sze e Emanuel E. Landsman, professor associado do Instituto de Engenharia Elétrica e de Computação de Massachusetts, cujo grupo desenvolveu novo chip. “Agora, as redes neurais são bastante complexas e funcionam principalmente em chips poderosos. Imagine que você pode transferir essa funcionalidade para o seu telefone celular ou dispositivo interno e, em seguida, processar grandes quantidades de informações sem usar uma conexão Wi-Fi. O processamento de grandes quantidades de dados no seu smartphone permitirá evitar o atraso decorrente da troca de dados com a rede, o que, por sua vez, permitirá que muitos aplicativos funcionem com muito mais eficiência. E aléma solução proposta garantirá uma nova qualidade de proteção de informações confidenciais ".As redes neurais, como regra, são implementadas com base em processadores gráficos multi-core (GPUs). Em uma conferência internacional em San Francisco, os pesquisadores do MIT divulgaram um novo chip de 168 núcleos, projetado para implementar algoritmos de inteligência artificial baseados em redes neurais. Comparado com uma GPU móvel (não é indicado, em comparação com qual), o processador demonstrou uma eficiência 10 vezes maior, o que permite usar um dispositivo móvel personalizado para executar localmente poderosos algoritmos de inteligência artificial sem a necessidade de enviar dados para o processamento na nuvem. Os destaques do desenvolvimento estão refletidos no comunicado de imprensa do MIT de 3 de fevereiro de 2016.O novo chip, chamado pelos desenvolvedores da Eyeriss, pode ser amplamente usado na Internet das Coisas, eletrônicos portáteis, veículos autônomos, equipamentos de fabricação e até na agricultura, ajudando a resolver e coordenar as tarefas atuais. Com os algoritmos de inteligência artificial a bordo, os dispositivos móveis poderão tomar decisões em nível local, fornecendo ao usuário um resultado pronto como um guia de ação, em vez de um conjunto de dados brutos da Internet. E, é claro, uma das aplicações das redes neurais locais é o uso delas na criação de robôs autônomos para diversos fins.Divida e conquiste
As redes neurais, por via de regra, têm uma estrutura multicamada e cada camada contém um grande número de nós de processamento. No estágio inicial do processamento, os dados chegam e são distribuídos entre os nós da camada inferior. Após o processamento dos dados recebidos por cada um dos nós, o resultado é transmitido para processamento nos nós da próxima camada. Na saída da última camada, o resultado da solução do problema é formado. Consequentemente, para resolver problemas de larga escala usando o algoritmo descrito, serão necessários recursos computacionais significativos.Os requisitos inicialmente apresentados ao chip pelos próprios desenvolvedores os colocam em uma estrutura bastante rígida: por um lado, a solução deve ser eficiente em termos de energia, por outro, deve operar com blocos simples de informações. Finalmente, o chip deve ter a capacidade de simular vários tipos de redes neurais, levando em consideração os desafios atuais. Todos esses requisitos foram implementados com sucesso no processador Eyeriss.O chip desenvolvido no laboratório do MIT é uma rede neural já formada, localizada no nível de um processador de 168 núcleos, que no futuro poderá ser integrado a dispositivos móveis.A chave para a eficiência da Eyeriss é minimizar a frequência da troca de dados entre núcleos e bancos de memória externos, uma operação associada a alto consumo de energia e custos de tempo. Enquanto os núcleos das GPUs tradicionais estão vinculados a um banco de memória comum, cada núcleo da Eyeriss tem sua própria memória. Além disso, os dados passam por um procedimento de compactação antes do mandril para os núcleos vizinhos.Outra vantagem do algoritmo implementado é a capacidade dos núcleos de “se comunicar” diretamente entre si, ignorando o “intermediário” na forma de um barramento de memória do sistema. Esse é um recurso crítico para simular a Rede Neural Convolucional (CNN). Todo o trabalho computacional necessário para o reconhecimento de padrões e fala é realizado localmente no Eyeriss, sem a necessidade de acessar os recursos da rede, o que possibilita garantir o funcionamento eficaz do dispositivo, mesmo na ausência de uma rede externa.Por fim, outra vantagem da Eyeriss é o princípio da distribuição “inteligente” de tarefas individuais de computação entre núcleos, dentro da estrutura de um único problema solucionável. Na memória local, o kernel deve armazenar não apenas os dados processados pelos nós, mas também os dados que descrevem os próprios nós. Para garantir o desempenho máximo do processo de processamento de dados, bem como carregar a Eyeriss com a quantidade máxima de dados da memória principal, o algoritmo de distribuição de dados de ambos os tipos é otimizado por um chip em tempo real especialmente projetado para esse fim, levando em consideração as características da rede neural atual.Na Conferência Internacional de Circuitos de Estado Sólido, em São Francisco, a equipe de desenvolvimento, usando os recursos do chip Eyeriss no nível do usuário, demonstrou a implementação do algoritmo de reconhecimento de padrões na rede neural local. Uma tarefa semelhante - observada em um comunicado de imprensa - foi implementada anteriormente, mas no nível de projetos governamentais da mais moderna das redes neurais criadas."Este trabalho é muito importante porque demonstra como os processadores detalhados eficientemente incorporados podem fornecer o desempenho necessário de energia e otimização e trazer processos complexos de computação da nuvem para dispositivos móveis", diz Mike Polly, vice-presidente sênior do laboratório de processadores móveis da Samsung, Innovation Lab. acrescentando: “Além de uma gama inovadora de soluções de hardware, um estudo realizado por especialistas do MIT demonstra claramente como o núcleo incorporado pode ser útil para o desenvolvimento aplicações manipulador usando uma arquitetura de rede padrão e AlexNet Caffe ».O financiamento do projeto Eyeriss, começando com a criação de uma unidade baseada no laboratório do MIT, foi parcialmente financiado pelo departamento de defesa americano DARPA. Não surpreende que o primeiro a responder ao anúncio do processador com impressionante material editorial tenha sido o famoso analista militar Patrick Tucker. Segundo ele, os novos processadores Eyeriss instalados em dispositivos móveis de soldados americanos serão capazes de resolver os problemas computacionais mais complexos associados ao processamento de grandes quantidades de informações sem se conectar a uma rede comum.Portanto, atualmente, a Força Aérea dos EUA recebe até 1.500 horas de vídeo em HD e até 1.500 fotos de resolução ultra-alta de drones pairando sobre o Afeganistão. Além disso, todo esse fluxo interminável de informações deve ser visualmente analisado pelos operadores à moda antiga, já que o software de computador existente não é capaz de distinguir um camponês que anda com uma bengala ao longo de um caminho na montanha de um terrorista com um lançador de mísseis guiados. Para resolver esses problemas, foram criados inicialmente métodos de aprendizado de máquina baseados em treinamento representativo.Os processadores Eyeriss são ideais para instalação em drones militares não tripulados, pois permitem o processamento inteligente de uma variedade de imagens e vídeos usando tecnologias de "aprendizado profundo" diretamente a bordo da aeronave. Ao mesmo tempo, os dados úteis selecionados poderiam ser enviados diretamente para as unidades de combate que operam na região especificada, ignorando o centro de análise de informações operacionais.Breve resumoDurante os experimentos, o chip Eyeriss demonstrou um nível de eficiência energética dez vezes maior que o dos modernos chips gráficos móveis. Ao mesmo tempo, com sua ajuda, é tecnologicamente possível garantir a operação de algoritmos de inteligência artificial em dispositivos com tamanhos compactos - de smartphones e tablets - a eletrônicos portáteis. Os atrasos criados pelas redes durante a troca de dados para esse processador acabam sendo minimizados, pois a maioria dos cálculos pode ser realizada localmente pelo chip. Com base na Eyeriss, será possível criar não apenas todos os tipos de “dispositivos inteligentes”, mas também robôs com um certo grau de independência na tomada de decisões.Os desenvolvedores do MIT ainda não nomearam intervalos de tempo específicos durante os quais a Eyeriss poderá se transformar em um produto comercial e com todo o seu poder para revelar suas capacidades no nível do consumidor. Algum envolvimento no desenvolvimento dos principais especialistas da NVIDIA e o grande interesse de pesquisadores responsáveis da Samsung estão inspirando otimismo.Fonte
Caros leitores, estamos sempre felizes em conhecê-lo e aguardá-lo nas páginas do nosso blog. Estamos prontos para continuar compartilhando com você as últimas notícias, revisar materiais e outras publicações e tentaremos fazer o possível para tornar útil o tempo gasto conosco. E, claro, não se esqueça de se inscrever em nossas colunas . Nossos outros artigos e eventos
Source: https://habr.com/ru/post/pt390627/
All Articles