DeepMind e Google: a batalha pelo controle sobre IA forte


Demis Hassabis fundou a empresa para criar a IA mais poderosa do mundo. Então foi comprado pelo Google

Em agosto de 2010, um londrino de 34 anos chamado Demis Hassabis subiu ao palco em uma sala de conferências em um subúrbio de São Francisco. Ele saiu com um passo vagaroso de um homem que estava tentando controlar seus nervos, apertou os lábios em um breve sorriso e começou: "Então, hoje vamos falar sobre diferentes abordagens de desenvolvimento ..." - ele hesitou, como se de repente percebesse que estava expressando pensamentos ambiciosos secretos. Mas ele ainda disse: "... uma IA forte".

IA forte (inteligência geral artificial ou AGI) significa inteligência artificial universal - um programa de computador hipotético capaz de executar tarefas intelectuais como pessoa ou até melhor. Uma IA forte será capaz de executar tarefas individuais, como reconhecimento de foto ou tradução de texto, que são as únicas tarefas de cada uma das IA fracas em nossos telefones e computadores. Mas ele também vai jogar xadrez e fala francês. Ele entenderá artigos sobre física, escreverá romances, desenvolverá estratégias de investimento e conduzirá deliciosas conversas com estranhos. Ele monitorará as reações nucleares, gerenciará as redes elétricas e os fluxos de tráfego e, sem muito esforço, terá sucesso em todo o resto. A AGI fará com que a IA mais avançada de hoje pareça uma calculadora de bolso.

A única inteligência atualmente capaz de executar todas essas tarefas é aquela com a qual as pessoas são dotadas. Mas a inteligência humana é limitada pelo tamanho do crânio. A força do nosso cérebro é limitada pela quantidade insignificante de energia que o corpo pode fornecer. Como o AGI é executado em computadores, ele não sofrerá nenhuma dessas limitações. A inteligência forte é limitada apenas pelo número de processadores disponíveis. Ele pode começar monitorando as reações nucleares. Mas abrirá rapidamente novas fontes de energia, digerindo mais trabalho científico em física por segundo do que uma pessoa pode fazer em mil vidas. A inteligência humana, combinada com a velocidade e escalabilidade dos computadores, fará desaparecer problemas que atualmente parecem insolúveis. Em entrevista ao British Observer, Hassabis disse que, entre outras coisas, uma IA forte precisa dominar essas disciplinas e resolver problemas como “câncer, mudança climática, energia, genômica, macroeconomia [e] sistemas financeiros”.

A conferência de Hassabis foi chamada de Singularity Summit. Segundo os futurologistas, a singularidade é uma das conseqüências mais prováveis ​​do aparecimento da AGI. Como processa informações em alta velocidade, fica mais rápido rapidamente. Ciclos rápidos de auto-aperfeiçoamento levarão a uma explosão de inteligência da máquina, deixando as pessoas muito para trás para engasgar com o pó de silício. Como esse futuro é inteiramente construído com base em suposições não verificadas, a questão de se a singularidade é considerada utopia ou inferno é quase religiosa.

A julgar pelos nomes das palestras da conferência, os participantes gravitam em direção ao messianismo: "Razão e como construí-la"; “IA como solução para o problema do envelhecimento”; "Substituição de nossos corpos"; "Mudando a fronteira entre a vida e a morte." A palestra de Hassabis, por outro lado, não parece muito impressionante: "Uma abordagem neurobiológica sistêmica para a construção de um AGI".

Hassabis caminha entre o pódio e a tela, dizendo algo rapidamente. Ele está vestindo um cardigã marrom e uma camisa branca com botões, como um estudante. Um pequeno crescimento, ao que parece, apenas fortalece sua inteligência. Até agora, explicou Hassabis, os cientistas abordaram a AGI de dois lados. No campo da IA ​​simbólica, os pesquisadores tentaram descrever e programar todas as regras para um sistema que pudesse pensar como uma pessoa. Essa abordagem foi popular nos anos 80-90, mas não deu os resultados desejados. Hassabis acredita que a estrutura mental do cérebro é sofisticada demais para ser descrita dessa maneira.

Pesquisadores que tentaram reproduzir as redes físicas do cérebro em formato digital trabalharam em outra área. Isso tinha um significado definido. Afinal, o cérebro é o receptáculo da inteligência humana. Mas esses pesquisadores foram enganados, disse Hassabis. A tarefa deles acabou sendo da mesma escala que uma tentativa de mapear todas as estrelas do universo. Além disso, ele se concentra no nível errado. É como tentar entender como o Microsoft Excel funciona desmontando um computador e estudando interações de transistor.

Em vez disso, Hassabis propôs um meio termo: uma IA forte deveria inspirar-se nos métodos amplos pelos quais o cérebro processa informações, e não nos sistemas físicos ou regras específicas que se aplicam em situações específicas. Em outras palavras, os cientistas devem se concentrar em entender o software do cérebro, não o hardware. Novos métodos, como a ressonância magnética funcional, permitem que você olhe dentro do cérebro durante sua atividade. Eles tornam possível esse entendimento. Estudos recentes mostraram que o cérebro aprende em um sonho, reproduzindo novamente as experiências recebidas, a fim de derivar princípios gerais. Os pesquisadores de IA devem imitar esse sistema.

Um logotipo apareceu no canto inferior direito do slide - um redemoinho azul redondo. Abaixo, há duas palavras: DeepMind. Esta foi a primeira menção pública de uma nova empresa.



Hassabis passou um ano inteiro tentando fazer um convite para a Singularity Summit. A palestra foi apenas uma capa. O que ele realmente precisava era de um minuto com Peter Thiel, o bilionário do Vale do Silício que patrocinou a conferência. Hassabis queria seu investimento.

Hassabis nunca disse por que procurou obter apoio precisamente de Thiel (neste artigo, ele recusou vários pedidos de entrevista por meio de um porta-voz). Conversamos com 25 fontes, incluindo funcionários e investidores atuais e antigos. A maioria deles falou anonimamente porque não tinha o direito de falar sobre a empresa. Mas Thiel acredita na AGI com fervor ainda maior do que Hassabis. Em um discurso em 2009, Thiel disse que seu maior medo pelo futuro não é um levante robótico (embora na Nova Zelândia, isolado do mundo inteiro, ele esteja mais protegido do que a maioria das pessoas). Em vez disso, ele teme que a singularidade chegue tarde demais. O mundo precisa de novas tecnologias para evitar uma crise econômica.

Por fim, a DeepMind recebeu £ 2 milhões em financiamento de capital de risco; incluindo 1,4 milhão de libras esterlinas de Thiel. Quando o Google comprou a empresa em janeiro de 2014 por US $ 600 milhões, os primeiros investidores registraram um lucro de 5.000%.

Para muitos fundadores, este seria um final feliz. Você pode desacelerar, dar um passo atrás e aproveitar o dinheiro. Para Hassabis, o acordo com o Google foi outro passo em sua busca por uma IA forte. Ele passou quase todo o ano de 2013 em negociações sobre o acordo. O DeepMind atuará separadamente da empresa controladora. A Hassabis receberá todos os privilégios corporativos, como acesso ao fluxo de caixa e poder de processamento, sem perder o controle da empresa.

Hassabis achou que o DeepMind seria um híbrido: ele teria uma iniciativa, os cérebros das melhores universidades e os bolsos profundos de uma das empresas mais ricas do mundo. Tudo foi feito para acelerar o desenvolvimento de uma IA forte e ajudar a humanidade.



Demis Hassabis nasceu no norte de Londres em 1976, na família de um cipriota grego e um chinês de Singapura. Ele era o mais velho de três irmãos e irmãs. Mamãe trabalhava na loja de departamentos John Lewis e seu pai trabalhava em uma loja de brinquedos. O menino aprendeu a jogar xadrez aos quatro anos de idade, assistindo ao jogo de seu pai e tio. Depois de algumas semanas, os adultos não conseguiam mais vencê-lo. Aos 13 anos, Demis se tornou o segundo jogador de xadrez do mundo em sua idade. Aos oito anos, ele aprendeu independentemente a programar.

Em 1992, Hassabis se formou na escola dois anos antes do previsto. Ele conseguiu um emprego na programação de videogames na Bullfrog Productions, onde escreveu o jogo Theme Park. Nele, os jogadores construíram e gerenciaram um parque de diversões virtual. O jogo teve muito sucesso, com 15 milhões de cópias vendidas. Pertencia a um novo gênero de simuladores, no qual o objetivo não é derrotar o inimigo, mas otimizar o funcionamento de um sistema tão complexo como um negócio ou uma cidade.


Parque Temático para Android, 2018

Demis não apenas desenvolveu jogos, mas também jogou ótimos jogos. Quando adolescente, ele estava dividido entre competições de xadrez, scrabble, pôquer e gamão. Em 1995, enquanto estudava ciências da computação na Universidade de Cambridge, Hassabis participou de um torneio de estudantes. Este é um jogo antigo de estratégia de tabuleiro, muito mais complicado que o xadrez. Supõe-se que o domínio requer intuição adquirida através de uma longa experiência. Ninguém sabia se Hassabis havia jogado antes.

Primeiro, Hassabis venceu o torneio para iniciantes. Então ele venceu o vencedor do torneio por jogadores experientes, embora com uma desvantagem. Organizador do torneio, o mestre de Cambridge Charles Matthews lembra o choque de um jogador experiente depois de perder para um novato de 19 anos. Matthews tomou Hassabis sob seus cuidados.

A inteligência e as ambições de Hassabis sempre foram evidentes nos jogos. Games, por sua vez, despertou seu interesse pela inteligência. Observando seu progresso no xadrez, ele se perguntou: é possível programar computadores para que eles aprendam como ele, com base na experiência. Os jogos ofereciam um ambiente de aprendizado que o mundo real não podia igualar. Eles eram claros e auto-suficientes. Como os jogos são separados da realidade, eles podem ser praticados sem interferir no mundo real e dominados de maneira eficaz. Os jogos aceleram o tempo: em alguns dias você pode criar um sindicato criminoso, e a batalha no Somme termina em questão de minutos.

No verão de 1997, Hassabis viajou para o Japão. Em maio daquele ano, o computador Deep Blue da IBM derrotou o campeão mundial de xadrez Garry Kasparov. Pela primeira vez, um computador venceu um grande mestre de xadrez. A partida atraiu a atenção mundial e levantou preocupações sobre o poder crescente e a ameaça potencial de computadores. Quando Hassabis se encontrou com o mestre japonês de jogos de tabuleiro Masahiko Fujuvarea, ele falou sobre um plano que combina seus interesses em jogos estratégicos e inteligência artificial: um dia ele criará um programa de computador que derrotará o melhor jogador do mundo.

Hassabis agiu metodicamente: "Aos 20 anos, Hassabis era da opinião de que certas coisas deveriam estar em vigor antes que ele se envolvesse em IA no nível que desejava", diz Matthews. "Ele tinha um plano."

Em 1998, ele fundou seu próprio estúdio de jogos Elixir. Hassabis se concentrou em um jogo extremamente ambicioso - Republic: The Revolution, um complexo simulador político. Muitos anos atrás, na escola, Hassabis disse a seu amigo Mustafa Suleiman que o mundo precisava de um simulador grandioso para simular sua dinâmica complexa e resolver os problemas sociais mais complexos. Agora ele tentou fazer isso no jogo.

Ajustar-se à estrutura do jogo foi mais difícil do que ele esperava. No final, o Elixir lançou uma versão abreviada do jogo para amenizar as críticas. Outros jogos falharam (incluindo um simulador de vilão Bondian chamado Evil Genius). Em abril de 2005, Hassabis fechou o Elixir. Matthews acredita que Hassabis fundou a empresa simplesmente para ganhar experiência gerencial. Agora Demis precisava de apenas uma área importante de conhecimento para começar a trabalhar em uma IA forte. Ele precisava entender o cérebro humano.

Em 2005, Hassabis obteve um doutorado em neurociência na University College London (UCL). Ele publicou estudos famosos de memória e imaginação. Um de seus artigos, que já foi citado mais de mil vezes, mostrou que pessoas com amnésia também têm dificuldade em entender novas experiências, sugerindo que há uma conexão entre lembrar e criar imagens mentais. Hassabis criou uma representação cerebral adequada para a tarefa de criar AGI. A maior parte do trabalho se resumia a uma pergunta: como o cérebro humano recebe e preserva conceitos e conhecimentos?

Hassabis fundou oficialmente o DeepMind em 15 de novembro de 2010. Desde então, a missão da empresa não mudou: "resolver a inteligência" e usá-la para resolver todo o resto. Como Hassabis disse aos participantes do Singularity Summit, isso significa traduzir nossa compreensão de como o cérebro funciona em software que pode usar os mesmos métodos de auto-aprendizado.

Hassabis entende que a ciência ainda não compreendeu completamente a essência da mente humana. Um forte projeto de IA não pode simplesmente ser criado com base em centenas de estudos neurobiológicos. Mas ele acredita claramente que já se sabe o suficiente para começar a trabalhar em IA forte. E, no entanto, existe a possibilidade de que sua confiança esteja à frente da realidade. Ainda sabemos muito pouco como o cérebro realmente funciona. Em 2018, os resultados da tese de doutorado de Hassabis foram questionados por uma equipe de pesquisadores australianos. Este é apenas um artigo, mas mostra que as opiniões científicas subjacentes ao DeepMind estão longe de ser consensuais.

A empresa foi co-fundada por Mustafa Suleiman e Shane Legge, uma AGI neozelandesa obcecada que Hassabis também conheceu na UCL. A reputação da empresa estava crescendo e Hassabis estava colhendo os benefícios de seu talento. "É como um ímã", diz Ben Faulkner, ex-gerente de operações da DeepMind. Muitos funcionários moravam na Europa, longe dos departamentos de RH de gigantes do Vale do Silício, como Google e Facebook. Talvez a principal conquista do DeepMind tenha sido a contratação de funcionários imediatamente após sua fundação, a fim de encontrar e preservar os melhores e mais brilhantes talentos no campo da IA. A empresa abriu um escritório no sótão de uma casa na Russell Square, em Bloomsbury, do outro lado da rua da UCL.

Um dos métodos de aprendizado de máquina em que a empresa se concentrou surgiu da dupla paixão de Hassabis por jogos e neurociência: o aprendizado reforçado. Esse programa é projetado para coletar informações sobre o meio ambiente e depois estudá-lo, reproduzindo repetidamente a experiência adquirida, como a atividade do cérebro humano em um sonho, como Hassabis disse em sua palestra na Singularity Summit.

O treinamento de reforço começa do zero. O programa mostra um ambiente virtual sobre o qual não conhece nada além das regras. Por exemplo, uma simulação de um jogo de xadrez ou videogame. Um programa contém pelo menos um componente conhecido como rede neural. Consiste em camadas de estruturas computacionais que filtram informações para identificar funções ou estratégias específicas. Cada camada explora o ambiente em um novo nível de abstração. A princípio, essas redes operam com sucesso mínimo, mas é importante que cada falha deixe uma marca e seja codificada na rede. Gradualmente, a rede neural está se tornando mais sofisticada, pois está experimentando diferentes estratégias - e recebe uma recompensa se for bem-sucedida. Se o programa mover a peça de xadrez e, como resultado, perder o jogo, ele não repetirá esse erro. A maior parte da magia da inteligência artificial é a velocidade com que repete suas tarefas.

O ponto culminante do trabalho do DeepMind foi em 2016, quando a empresa lançou o programa AlphaGo, que utilizava treinamento de reforço junto com outros métodos para jogar. Para surpresa de todos, em um duelo de cinco partidas em Seul, o programa venceu o campeão mundial. 280 milhões de espectadores assistiram à vitória do carro: esse evento aconteceu uma década antes do que os especialistas previram. No ano seguinte, uma versão melhorada do AlphaGo derrotou o chinês go champion.

Como o Deep Blue em 1997, o AlphaGo mudou a percepção do que constitui a excelência humana. Os campeões de jogos de tabuleiro, algumas das mentes mais brilhantes do planeta, não eram mais considerados o auge da inteligência. Quase 20 anos depois de uma conversa com o mestre japonês Fujuwaraa, Hassabis cumpriu sua promessa. Mais tarde, ele disse que quase chorou durante a partida. Segundo a tradição, o aluno go agradece ao professor ao derrotá-lo no jogo. Hassabis agradeceu Matthews, derrotando o jogo inteiro.

O DeepBlue venceu graças à força bruta e à velocidade computacional, mas o estilo do AlphaGo parecia artístico, quase humano. Por sua graça e sofisticação, a superioridade dos músculos computacionais parecia mostrar que o DeepMind foi além dos concorrentes no desenvolvimento de um programa que poderia tratar doenças e gerenciar cidades.



Hassabis sempre disse que o DeepMind mudará o mundo para melhor. Mas não há certeza sobre IA forte. Se ele surgir, não sabemos se ele será altruísta ou malicioso, se será submetido ao controle humano. Mesmo assim, quem assumirá o controle?

Desde o início, Hassabis tentou defender a independência do DeepMind. Ele sempre insistiu para que o DeepMind ficasse em Londres. Quando o Google comprou a empresa em 2014, a questão do controle se tornou mais relevante. Hassabis não era obrigado a vender a empresa. Ele tinha dinheiro suficiente e delineou um modelo de negócios pelo qual a empresa desenvolve jogos para financiar pesquisas. As finanças do Google tinham peso, mas, como muitos fundadores, Hassabis não queria desistir da empresa em que havia crescido. Como parte do acordo, a DeepMind firmou um acordo que impediria o Google de controlar unilateralmente a propriedade intelectual da empresa.Segundo uma pessoa informada, antes da transação, as partes assinaram um contrato chamado Acordo de Revisão de Ética e Segurança. O acordo, que não foi divulgado anteriormente, foi elaborado por advogados sérios de Londres.

O acordo transfere o controle da tecnologia principal de uma IA forte para a DeepMind sempre que ela é criada, a saber, um grupo diretor chamado Conselho de Ética. Segundo a mesma fonte, o Conselho de Ética não é uma concessão cosmética do Google. Ele fornece à DeepMind um sólido suporte legal para manter o controle de sua tecnologia mais valiosa e potencialmente mais perigosa. Os nomes dos membros do conselho não foram divulgados, mas outra fonte próxima ao DeepMind e ao Google diz que inclui todos os três fundadores do DeepMind (a empresa se recusou a responder perguntas sobre o contrato, mas afirmou que “o controle da ética desde os primeiros dias era para nós). prioridade ”).

Hassabis pode determinar o destino do DeepMind de outras maneiras. Um deles é a lealdade da equipe. Funcionários anteriores e atuais dizem que o programa de pesquisa da Hassabis é um dos maiores pontos fortes da DeepMind. Seu programa oferece um trabalho fascinante e importante, livre da pressão dos círculos acadêmicos. Tais condições atraíram centenas dos especialistas mais talentosos do mundo. A DeepMind possui subsidiárias em Paris e Alberta. Muitos funcionários se sentem mais próximos de Hassabis e de sua missão do que da empresa controladora, que anseia por receita. Enquanto Hassabis mantém lealdade pessoal, ele tem poder significativo sobre seu único acionista. Para o Google, é melhor que os talentos da DeepMind trabalhem para ela através de um intermediário do que eles irão para o Facebook ou a Apple.

O DeepMind tem mais uma alavanca, embora exija reposição constante: publicidade favorável. A empresa está indo bem. AlphaGo se tornou uma verdadeira bomba de relações públicas. Desde a aquisição do Google, a empresa produziu repetidamente milagres que atraíram a atenção mundial. Um programa DeepMind pode diagnosticar doenças oculares, verificando a retina. Outro aprendeu a jogar xadrez do zero usando a arquitetura no estilo AlphaGo, tornando-se o maior jogador de xadrez de todos os tempos em apenas nove horas de auto-estudo. Em dezembro de 2018, um programa chamado AlphaFold superou seus concorrentes na tarefa de prever a estrutura tridimensional de proteínas usando uma lista de componentes, potencialmente abrindo caminho para o tratamento de doenças como a doença de Parkinson e Alzheimer.

A DeepMind está particularmente orgulhosa dos algoritmos desenvolvidos que calculam os meios de refrigeração mais eficazes dos data centers do Google, onde aproximadamente 2,5 milhões de servidores estão em execução. A DeepMind disse em 2016 que reduziu os custos de energia do Google em 40%. Mas alguns especialistas dizem que essa é uma figura exagerada. O Google usou algoritmos para otimizar os data centers muito antes do DeepMind: "Eles só querem que um pouco de RP agregue valor ao Alphabet", diz um funcionário do Google. A empresa-mãe da Alphabet, Google, paga generosamente ao DeepMind por esses serviços. Portanto, em 2017, a DeepMind cobrou 54 milhões de libras. Esse valor é pouco em comparação com as despesas atuais da DeepMind: foram gastos apenas US $ 200 milhões em funcionários naquele ano.Em geral, as perdas da DeepMind em 2017 foram de 282 milhões de libras.

Estes são centavos miseráveis ​​para o rico gigante da Internet. Mas outras empresas não lucrativas, Alphabet, atraíram a atenção de Ruth Porat, a frugal diretora financeira da Alphabet. Por exemplo, a divisão Google Fiber tentou criar um provedor de serviços de Internet de alta velocidade executando linhas de fibra óptica em residências particulares. Mas o projeto foi suspenso quando ficou claro que levaria décadas para retornar o investimento. Portanto, é importante que os pesquisadores de IA comprovem sua relevância para não atrair a aparência tenaz da Sra. Porat, cujo nome já se tornou um nome familiar no alfabeto.

As realizações planejadas do DeepMind em IA fazem parte de uma estratégia de relacionamento com os proprietários da empresa. DeepMind sinaliza sua reputação. Isso é especialmente importante quando o Google é acusado de invadir a privacidade do usuário e espalhar notícias falsas. A DeepMind também teve a sorte de ter um apoiante no mais alto nível: Larry Page, um dos dois fundadores do Google, hoje CEO da Alphabet. Page é a coisa mais próxima que Hassabis tem da empresa controladora. O pai de Page, Carl, estudou redes neurais nos anos 60. No início de sua carreira, Page disse que criou o Google apenas para fundar a empresa de IA.

O controle rígido sobre o DeepMind, para parecer bem aos olhos da imprensa, não corresponde exatamente ao espírito acadêmico que permeia a empresa. Alguns pesquisadores reclamam que é difícil para eles publicar seu trabalho: eles precisam superar vários níveis de censura interna antes que possam pelo menos enviar um relatório para a conferência ou um artigo para a revista. A DeepMind acredita que você precisa ter cuidado para não assustar o público com a perspectiva de uma IA forte. Mas um silêncio muito denso pode arruinar a atmosfera acadêmica e enfraquecer a lealdade dos funcionários.

Cinco anos após a aquisição do Google, a questão de quem controla o DeepMind está se aproximando de um ponto crítico. Os fundadores e primeiros funcionários da empresa em breve poderão sair com sua compensação financeira (as ações da Hassabis, provavelmente após a compra do Google, valem cerca de 100 milhões de libras). Mas uma fonte próxima à empresa sugere que a Alphabet adiou a monetização das opções dos fundadores em dois anos. Dado seu foco incansável na missão, é improvável que Hassabis saia do navio. O dinheiro só lhe interessa na medida em que ajuda a atingir o objetivo de toda a sua vida. Mas alguns colegas já foram embora. Desde o início de 2019, três engenheiros de IA deixaram a empresa. E Ben Laurie, um dos profissionais de segurança mais famosos do mundo, agora voltou ao Google, para seu empregador anterior. Esse número é pequenoAfinal, o DeepMind oferece uma missão tão emocionante e um salário decente que poucos saem.

Até agora, o Google não interveio no DeepMind. Mas um evento recente levantou preocupação sobre quanto tempo a empresa será capaz de manter a independência.


O DeepMind sempre planejou usar a IA para melhorar a assistência médica. Em fevereiro de 2016, foi criada uma nova divisão da DeepMind Health, liderada por Mustafa Suleiman, um dos co-fundadores. Suleiman, cuja mãe trabalhava como enfermeira no Serviço Nacional de Saúde (NHS), esperava criar um programa chamado Streams que alertaria os médicos quando a saúde de um paciente piorasse. O DeepMind teve que ganhar em todas as operações eficazes do sistema. Como esse trabalho exigia acesso a informações confidenciais dos pacientes, Suleiman criou o Independent Review Panel (IRP), que incluía representantes dos setores de saúde e tecnologia britânicos. O DeepMind agiu com muito cuidado. Posteriormente, o Comissário Britânico de Informações descobriuque um dos hospitais parceiros violou a lei durante o processamento de dados do paciente. No entanto, até o final de 2017, Suleiman havia assinado acordos com quatro grandes hospitais do NHS.

Em 8 de novembro de 2018, o Google anunciou a criação de sua própria divisão do Google Health. Cinco dias depois, eles anunciaram que o DeepMind Health deveria ser incluído na unidade dos pais. Aparentemente, o DeepMind não avisou ninguém. De acordo com os documentos que recebemos mediante solicitação, de acordo com a Lei de Liberdade de Informação, a DeepMind notificou os hospitais parceiros sobre essa alteração em apenas três dias. A empresa se recusou a informar quando as discussões sobre a fusão começaram, mas disse que a curta diferença entre o aviso e o anúncio público era do interesse da transparência. Suleiman escreveu em 2016 que "em nenhum momento os dados do paciente serão associados ou associados a contas, produtos ou serviços do Google". Parece que sua promessa foi quebrada. (Respondendo a perguntas de nossa publicação, a DeepMind disseque “nesse estágio, nenhum de nossos contratos foi para o Google, e isso só é possível com o consentimento de nossos parceiros. O fato de o Streams se tornar um serviço do Google não significa que os dados do paciente ... possam ser usados ​​em outros produtos ou serviços do Google. ”)

A anexação do Google irritou os funcionários da DeepMind Health. De acordo com pessoas próximas a esta unidade, após a conclusão da aquisição, muitos funcionários planejam sair. Um dos membros do IRP, Mike Bracken, já foi embora. De acordo com várias pessoas familiarizadas com o evento, Bracken saiu em dezembro de 2017 devido a temores de que a "comissão de controle" seja mais uma vitrine do que uma verdadeira supervisão. Quando Bracken perguntou a Suleiman se ele seria responsável perante a comissão e igualou seus poderes aos diretores não executivos, Suleiman apenas sorriu. (Um porta-voz do DeepMind disse que "não se lembra" desse incidente.) Julian Huppert, chefe do IRP, afirma que o grupo forneceu "governança mais radical" do que Brecken esperava, pois os membros podiam falar abertamente e não estavam vinculados por um dever de confidencialidade.

Este episódio revela que as unidades periféricas do DeepMind são vulneráveis ​​ao Google. A declaração do DeepMind disse: "Todos concordamos que faz sentido combinar esses esforços em um único projeto conjunto com um recurso mais poderoso". A questão é se o Google aplicaria a mesma lógica ao trabalho do DeepMind em IA forte.

Do lado de fora, parece que o DeepMind alcançou grande sucesso. Ela já desenvolveu um software capaz de aprender a concluir tarefas em um nível sobre-humano. Hassabis frequentemente menciona Breakout, um videogame para o console Atari. O jogador do Breakout controla a plataforma na parte inferior da tela e reflete a bola que ricocheteia nos blocos no topo, desmoronando com o golpe. O jogador vence quando todos os blocos são destruídos. Perde se ele errar a bola. Sem instruções humanas, o programa DeepMind não apenas aprendeu a jogar, mas também desenvolveu uma estratégia para lançar a bola no espaço acima dos blocos, onde pula por um longo tempo e ganha muitos pontos sem esforço por parte do jogador. Segundo Hassabis, isso demonstra o poder do aprendizado reforçado e as habilidades paranormais dos programas de computador DeepMind.

Uma demonstração impressionante. Mas Hassabis está faltando alguma coisa. Se você mover a plataforma virtual pelo menos alguns pixels para cima, o programa falhará. A habilidade adquirida pelo DeepMind é tão limitada que nem consegue responder a pequenas mudanças ambientais que as pessoas podem levar em consideração - pelo menos não sem milhares de rodadas extras de treinamento. Mas essas mudanças são parte integrante da realidade circundante. Não há dois órgãos idênticos para o diagnosticador. Para um mecânico, nenhum mecanismo pode ser configurado igualmente. Portanto, sistemas treinados no espaço virtual podem ter dificuldades ao iniciar em condições reais.

O segundo problema, do qual o DeepMind raramente fala, é que o sucesso em ambientes virtuais depende de ter uma função de recompensa: um sinal que permite que uma rede neural avalie seu progresso. O programa vê que vários rebotes da parede traseira aumentam a pontuação. Uma parte essencial do desenvolvimento do AlphaGo foi a criação de uma função de recompensa compatível com um jogo tão complexo. Infelizmente, o mundo real não oferece recompensas simples. O progresso raramente é medido por pontos individuais. Mesmo que existam, a tarefa é complicada por problemas políticos. A definição do sinal de recompensa para melhorar o clima (concentração de CO₂ na atmosfera) contradiz o sinal de recompensa para as empresas de petróleo (preço das ações) e requer um compromisso com muitas pessoas com motivações conflitantes. Os sinais de recompensa são geralmente muito fracos.O cérebro humano raramente recebe feedback claro sobre o sucesso de uma tarefa durante sua execução.



O DeepMind encontrou uma maneira eficaz de aprender usando uma enorme quantidade de recursos de computação. O programa AlphaGo estudou por milhares de anos jogando antes de entender alguma coisa. Muitos especialistas em IA suspeitam que esse método não funcione para tarefas que oferecem recompensas mais fracas. O DeepMind reconhece o problema. Recentemente, ela se concentrou no StarCraft 2, um jogo estratégico de computador. As decisões tomadas no início do jogo têm conseqüências muito mais tarde, mais próximas do feedback confuso e tardio no mundo real. Em janeiro, o DeepMind derrotou alguns dos melhores jogadores do mundo na demo, que, apesar de muito limitada, ainda era impressionante. Seus programas também começaram a estudar funções de recompensa, levando em consideração o feedback de um professor humano. Mas, ao empregar um professor, você corre o risco de perder as economias de escala e velocidade que o puro processamento de computador oferecia.

Os atuais e ex-pesquisadores da DeepMind e do Google, que pediram para permanecer anônimos devido a acordos estritos de não divulgação, também expressaram ceticismo de que, usando esses métodos, o DeepMind possa criar uma forte IA. Segundo eles, a ênfase no alto desempenho em ambientes virtuais dificulta a solução do problema com o sinal de recompensa. Ainda assim, uma abordagem de jogo está no centro do DeepMind. A empresa possui uma tabela de líderes interna onde os programas das equipes de programação concorrentes competem por domínios virtuais.

Hassabis sempre percebeu a vida como um jogo. A maior parte de sua carreira é dedicada ao desenvolvimento de jogos, e a maior parte de seu tempo livre é dedicada à prática de jogos. Na DeepMind, ele escolheu os jogos como seu principal meio de criar IA forte. Como seu software, o Hassabis só pode aprender com sua própria experiência. As pessoas podem esquecer a tarefa inicial, pois o DeepMind já inventou algumas tecnologias médicas úteis e superou os maiores jogadores da classe dos jogos de tabuleiro. Essas são conquistas significativas, mas não aquelas que o fundador da empresa deseja. No entanto, ele ainda tem a chance de criar uma IA forte bem debaixo do nariz do Google, mas fora do controle da corporação. Se isso der certo, Demis Hassabis vencerá o jogo mais difícil.

Source: https://habr.com/ru/post/pt444234/


All Articles