Antecipando o inĂcio de um novo tĂłpico no curso "Redes Neurais em Python", preparamos para vocĂŞ uma tradução de um artigo interessante.
Um dos principais problemas na implementação da nova geração de computadores quânticos reside no cliente mais básico: o
qubit . Os Qubits podem interagir com qualquer objeto na vizinhança imediata que transfira
energia perto de seus prĂłprios
fótons errantes (ou seja, campos eletromagnéticos indesejados,
fĂ´nons (vibrações mecânicas de um dispositivo quântico) ou defeitos quânticos (irregularidades na superfĂcie do chip que apareceram durante a fase de fabricação), que pode imprevisivelmente mudar o estado dos qubits por conta prĂłpria.
O assunto é complicado por muitas tarefas que colocam as ferramentas usadas para controlar os qubits. Os Qubits são processados ​​e lidos por métodos
clássicos : sinais analĂłgicos na forma de campos eletromagnĂ©ticos, acoplados a uma placa fĂsica na qual um qubit Ă© construĂdo, por exemplo, em um microcircuito supercondutor. Imperfeições na eletrĂ´nica de controle (levando ao ruĂdo branco), interferĂŞncia de fontes externas de radiação e flutuações nos conversores digital-analĂłgico levam a erros estocásticos ainda maiores que pioram a operação de microcircuitos quânticos. Essas questões práticas afetam a precisĂŁo dos cálculos e, portanto, limitam a aplicação da prĂłxima geração de dispositivos quânticos.
Para aumentar o poder computacional dos computadores quânticos e abrir o caminho para a computação quântica em larga escala, Ă© necessário primeiro criar modelos fĂsicos que descrevam com precisĂŁo esses problemas experimentais.
No artigo
“Controle Quântico Universal por meio do Aprendizado por Reforço Profundo” , publicado no Nature Partner Journal (npj) Informações Quânticas (https://www.nature.com/npjqi/articles), introduzimos uma nova estrutura de controle quântico criada usando aprendizado profundo com reforço no qual os problemas práticos de otimizar o controle quântico podem ser encapsulados com uma única função de
perda . A estrutura em consideração fornece uma redução no erro médio da
porta quântica para duas ordens de grandeza em comparação com as soluções estocásticas padrĂŁo de descida gradiente e uma redução significativa no tempo da porta para os valores Ăłtimos dos análogos da sĂntese da porta. Nossos resultados abrem novos horizontes para modelagem quântica, quĂmica quântica e testes de excelĂŞncia quântica usando dispositivos quânticos em um futuro prĂłximo.
A inovação desse paradigma de controle quântico Ă© baseada no desenvolvimento de uma função de controle quântico e de um mĂ©todo de otimização eficaz baseado em aprendizado profundo com reforço. Para desenvolver uma função abrangente de perda, precisamos primeiro desenvolver um modelo fĂsico de um processo realista de controle quântico no qual possamos prever com precisĂŁo a magnitude do erro. Um dos erros mais irritantes na avaliação da precisĂŁo da computação quântica Ă© o vazamento: a quantidade de informações quânticas perdidas durante o cálculo. Esse vazamento geralmente ocorre quando o estado quântico de um qubit muda para um nĂvel de energia mais alto ou para um valor mais baixo devido Ă emissĂŁo espontânea. Devido ao erro de vazamento, nĂŁo apenas as informações quânticas Ăşteis sĂŁo perdidas, mas tambĂ©m degrada a “quantumidade” e, finalmente, reduz o desempenho de um computador quântico ao desempenho de um computador com arquitetura clássica.
Uma prática comum para estimar com precisĂŁo informações perdidas durante uma computação quântica Ă© modelar a computação inteira primeiro. No entanto, isso nega o objetivo de criar computadores quânticos em larga escala, uma vez que sua vantagem Ă© que eles sĂŁo capazes de realizar cálculos impossĂveis para computadores clássicos. Com o aprimoramento da modelagem fĂsica, nossa função de perda comum nos permite otimizar conjuntamente erros de vazamento acumulados, violações das condições dos limites de controle, tempo total da válvula e precisĂŁo da válvula.
Com a nova função de gerenciamento de perdas, o prĂłximo passo Ă© usar uma ferramenta de otimização eficaz para minimizá-la. Os mĂ©todos de otimização existentes nĂŁo sĂŁo bons o suficiente para procurar soluções de alta precisĂŁo que sejam confiáveis ​​para controlar flutuações. Em vez disso, usamos um mĂ©todo baseado no mĂ©todo dentro da polĂtica de aprendizado profundo com reforço (RL),
RL - uma área confiável . Como esse mĂ©todo demonstra bom desempenho em todas as tarefas de teste, Ă© inerentemente resistente ao ruĂdo da amostra e pode otimizar problemas complexos de controle com centenas de milhões de parâmetros de controle. Uma diferença significativa entre esse mĂ©todo de RL dentro da polĂtica e os mĂ©todos de RL fora da polĂtica estudados anteriormente Ă© que a polĂtica de gerenciamento Ă© apresentada independentemente do gerenciamento de perdas. Por outro lado, todas as polĂticas de RL, como
Q-learning , usam uma única rede neural para representar o caminho de controle e a recompensa associada, onde a trajetória de controle determina os sinais de controle que devem ser associados aos qubits em diferentes medidas, e a recompensa associada mede a qualidade do tato. controle quântico.
A RL dentro da polĂtica Ă© bem conhecida por sua capacidade de usar recursos nĂŁo locais nos caminhos de controle, o que se torna crĂtico quando o cenário de controle Ă© multidimensional e repleto de um nĂşmero combinatorialmente grande de soluções nĂŁo globais, como costuma ser o caso dos sistemas quânticos.
Codificamos o caminho de controle em uma polĂtica de rede neural - NN totalmente conectada em trĂŞs camadas, e a função de perda de controle no valor da segunda rede neural - NN, que reflete o prĂŞmio futuro descontado. Soluções de controle confiáveis ​​foram obtidas com agentes de aprendizado por reforço que treinam ambas as redes neurais em um ambiente estocástico que simula controle de ruĂdo realista. Oferecemos uma solução para controlar um conjunto de portas quânticas de dois qubit continuamente parametrizados, que sĂŁo de particular importância na aplicação Ă quĂmica quântica, mas sĂŁo muito caras para implementar usando um conjunto universal de portas padrĂŁo.

Dentro da estrutura dessa nova estrutura, nossa simulação numĂ©rica mostra uma diminuição de cem vezes nos erros de portas quânticas e uma redução no tempo de portas para a famĂlia de portas quânticas de simulação continuamente parametrizadas por uma mĂ©dia de uma ordem de magnitude em comparação com abordagens tradicionais usando um conjunto universal de portas.
Este trabalho enfatiza a importância do uso de novos métodos de aprendizado de máquina e dos mais recentes algoritmos quânticos que usam a flexibilidade e o poder de processamento adicional de um circuito universal de controle quântico. Para integrar totalmente o aprendizado de máquina e aumentar os recursos computacionais, é necessário realizar experimentos adicionais, semelhantes aos apresentados neste trabalho.