Demis Hassabis a fondé l'entreprise pour créer l'IA la plus puissante au monde. Ensuite, il a été acheté par GoogleEn août 2010, un Londonien de 34 ans nommé Demis Hassabis est monté sur scène dans une salle de conférence dans la banlieue de San Francisco. Il est sorti avec une démarche tranquille d'un homme qui essayait de contrôler ses nerfs, a pincé les lèvres dans un bref sourire et a commencé: "Donc, aujourd'hui, nous parlerons de différentes approches du développement ..." - il a hésité, comme s'il réalisait soudain qu'il exprimait des pensées ambitieuses secrètes. Mais il a quand même dit: "... une IA forte."
Une IA forte (intelligence générale artificielle ou AGI) signifie une intelligence artificielle universelle - un programme informatique hypothétique capable d'effectuer des tâches intellectuelles en tant que personne ou même mieux. Une IA forte sera en mesure d'effectuer des tâches individuelles, telles que la reconnaissance photo ou la traduction de texte, qui sont les seules tâches de chacune des IA faibles de nos téléphones et ordinateurs. Mais il jouera également aux échecs et parlera français. Il comprendra des articles sur la physique, composera des romans, développera des stratégies d'investissement et mènera de charmantes conversations avec des étrangers. Il surveillera les réactions nucléaires, gérera les réseaux électriques et les flux de trafic et réussira sans trop d'efforts dans tout le reste. AGI fera ressembler l'IA la plus avancée d'aujourd'hui à une calculatrice de poche.
La seule intelligence actuellement capable d'accomplir toutes ces tâches est celle dont les gens sont dotés. Mais l'intelligence humaine est limitée par la taille du crâne. La force de notre cerveau est limitée par la quantité d'énergie négligeable que le corps peut fournir. Comme AGI fonctionne sur des ordinateurs, il ne souffrira d'aucune de ces limitations. L'intelligence forte n'est limitée que par le nombre de processeurs disponibles. Il peut commencer par surveiller les réactions nucléaires. Mais cela ouvrira rapidement de nouvelles sources d'énergie, digérant plus de travail scientifique en physique par seconde qu'une personne ne peut faire en mille vies. L'intelligence humaine, combinée à la vitesse et à l'évolutivité des ordinateurs, fera disparaître des problèmes qui semblent actuellement insolubles. Dans une interview avec l'
Observateur britannique
, Hassabis a déclaré que, entre autres choses, une IA forte doit maîtriser ces disciplines et résoudre des problèmes tels que «le cancer, le changement climatique, l'énergie, la génomique, la macroéconomie [et] les systèmes financiers».
La conférence Hassabis s'appelait Sommet de la singularité. Selon les futurologues, la singularité est l'une des conséquences les plus probables de l'apparition de l'AGI. Puisqu'il traite des informations à grande vitesse, il devient plus sage très rapidement. Des cycles rapides d'auto-amélioration entraîneront une explosion de l'intelligence de la machine, laissant les gens loin derrière pour s'étouffer avec la poussière de silicium. Puisque cet avenir est entièrement construit sur la base d'hypothèses non vérifiées, la question de savoir si la singularité est considérée comme une utopie ou un enfer est presque religieuse.
A en juger par les noms des conférences de la conférence, les participants gravitent vers le messianisme: «La raison et comment la construire»; «L'IA comme solution au problème du vieillissement»; "Remplacement de nos corps"; "Changer la frontière entre la vie et la mort." La conférence de Hassabis, en revanche, ne semble pas très impressionnante: "Une approche neurobiologique systémique de la construction de l'AGI."
Hassabis arpente entre le podium et l'écran, disant quelque chose rapidement. Il porte un cardigan marron et une chemise blanche à boutons, comme un écolier. Une petite croissance, semble-t-il, ne fait que renforcer son intelligence. Jusqu'à présent, a expliqué Hassabis, les scientifiques ont approché AGI de deux côtés. Dans le domaine de l'IA symbolique, les chercheurs ont tenté de décrire et de programmer toutes les règles d'un système qui pourrait penser comme une personne. Cette approche était populaire dans les années 80-90, mais n'a pas donné les résultats souhaités. Hassabis pense que la structure mentale du cerveau est trop sophistiquée pour être décrite de cette façon.
Les chercheurs qui ont tenté de reproduire les réseaux physiques du cerveau sous forme numérique ont travaillé dans un autre domaine. Cela avait un sens précis. Après tout, le cerveau est le réceptacle de l'intelligence humaine. Mais ces chercheurs ont été induits en erreur, a déclaré Hassabis. Leur tâche s'est avérée être à peu près à la même échelle qu'une tentative de cartographier toutes les étoiles de l'univers. De plus, il se concentre sur le mauvais niveau. C'est comme essayer de comprendre comment Microsoft Excel fonctionne en démontant un ordinateur et en étudiant les interactions des transistors.
Au lieu de cela, Hassabis a proposé un terrain d'entente: une IA forte devrait s'inspirer des grandes méthodes par lesquelles le cerveau traite les informations, et non des systèmes physiques ou des règles spécifiques qu'il applique dans des situations spécifiques. En d'autres termes, les scientifiques devraient se concentrer sur la compréhension du logiciel du cerveau, pas de son matériel. De nouvelles méthodes, telles que l'imagerie par résonance magnétique fonctionnelle, vous permettent de regarder à l'intérieur du cerveau pendant son activité. Ils permettent une telle compréhension. Des études récentes ont montré que le cerveau apprend dans un rêve, reproduisant les expériences reçues afin d'en tirer des principes généraux. Les chercheurs en IA doivent imiter ce système.
Un logo est apparu dans le coin inférieur droit de la diapositive - un tourbillon bleu rond. En dessous se trouvent deux mots: DeepMind. Il s'agissait de la première mention publique d'une nouvelle entreprise.

Hassabis a passé une année entière à essayer d'obtenir une invitation au Singularity Summit. La conférence n'était qu'une couverture. Ce dont il avait vraiment besoin, c'était d'une minute avec Peter Thiel, le milliardaire de la Silicon Valley qui a parrainé la conférence. Hassabis voulait son investissement.
Hassabis n'a jamais expliqué pourquoi il cherchait précisément à obtenir un soutien de Thiel (pour cet article, il a refusé plusieurs demandes d'interview par l'intermédiaire d'un porte-parole). Nous avons parlé avec 25 sources, y compris des employés et des investisseurs actuels et anciens. La plupart d'entre eux ont parlé de manière anonyme car ils n'avaient pas le droit de parler de l'entreprise. Mais Thiel croit en AGI avec une ferveur encore plus grande que Hassabis. Dans un discours en 2009, Thiel a déclaré que sa plus grande crainte pour l'avenir n'était pas un soulèvement robotique (bien qu'en Nouvelle-Zélande, isolé du monde entier, il soit mieux protégé que la plupart des gens). Il craint plutôt que la singularité ne vienne trop tard. Le monde a besoin de nouvelles technologies pour éviter un ralentissement économique.
En fin de compte, DeepMind a reçu 2 millions de livres sterling de financement en capital-risque; dont 1,4 million de livres sterling de Thiel. Lorsque Google a acheté la société en janvier 2014 pour 600 millions de dollars, les premiers investisseurs ont enregistré un bénéfice de 5 000%.
Pour de nombreux fondateurs, ce serait une fin heureuse. Vous pouvez ralentir, prendre du recul et profiter de l'argent. Pour Hassabis, l'accord avec Google était une autre étape dans sa quête d'une IA forte. Il a passé presque toute l'année 2013 dans les négociations sur l'accord. DeepMind agira séparément de la société mère. Hassabis recevra tous les privilèges de l'entreprise, tels que l'accès aux flux de trésorerie et à la puissance de traitement, sans perdre le contrôle de l'entreprise.
Hassabis pensait que DeepMind serait un hybride: il aurait un démarrage, le cerveau des plus grandes universités et les poches profondes de l'une des entreprises les plus riches du monde. Tout a été fait pour accélérer le développement d'une IA forte et aider l'humanité.
Demis Hassabis est né dans le nord de Londres en 1976 dans la famille d'un chypriote grec et d'un sino-singapourien. Il était l'aîné de trois frères et sœurs. Maman travaillait au grand magasin John Lewis et son père travaillait dans un magasin de jouets. Le garçon a appris à jouer aux échecs à l'âge de quatre ans, en regardant le match de son père et de son oncle. Après quelques semaines, les adultes ne pouvaient plus le battre. À l'âge de 13 ans, Demis est devenu le deuxième joueur d'échecs du monde à son âge. À huit ans, il a indépendamment appris à programmer.
En 1992, Hassabis est sorti de l'école avec deux ans d'avance. Il a obtenu un emploi de programmation de jeux vidéo chez Bullfrog Productions, où il a écrit le jeu Theme Park. Dans ce document, les joueurs ont construit et géré un parc d'attractions virtuel. Le jeu a connu un grand succès avec 15 millions d'exemplaires vendus. Il appartenait à un nouveau genre de simulateurs, dans lequel le but n'est pas de vaincre l'ennemi, mais d'optimiser le fonctionnement d'un système aussi complexe qu'une entreprise ou une ville.
Parc à thème pour Android, 2018Demis a non seulement développé des jeux, mais a également joué de grands jeux. Adolescent, il était déchiré entre les compétitions d'échecs, de scrabble, de poker et de backgammon. En 1995, alors qu'il étudiait l'informatique à l'Université de Cambridge, Hassabis s'est lancé dans un tournoi de go pour étudiants. Il s'agit d'un ancien jeu de stratégie de plateau, qui est beaucoup plus compliqué que les échecs. On suppose que la maîtrise nécessite une intuition acquise grâce à une longue expérience. Personne ne savait si Hassabis avait joué auparavant.
Tout d'abord, Hassabis a remporté le tournoi pour les débutants. Il a ensuite battu le vainqueur du tournoi pour les joueurs expérimentés, mais avec un handicap. Organisateur du tournoi, le capitaine de Cambridge Charles Matthews se souvient du choc d'un joueur expérimenté après avoir perdu face à une recrue de 19 ans. Matthews a pris Hassabis sous sa garde.
L'intelligence et les ambitions d'Hassabis ont toujours été évidentes dans les jeux. Les jeux, à leur tour, ont suscité son intérêt pour l'intelligence. Regardant ses progrès aux échecs, il se demande: est-il possible de programmer des ordinateurs pour qu'ils apprennent comme lui, sur la base de l'expérience. Les jeux offraient un environnement d'apprentissage que le monde réel ne pouvait égaler. Ils étaient clairs et autonomes. Les jeux étant séparés de la réalité, ils peuvent être pratiqués sans interférer avec le monde réel et maîtrisés efficacement. Les jeux accélèrent le temps: en quelques jours, vous pouvez créer un syndicat criminel, et la bataille sur la Somme se termine en quelques minutes.
À l'été 1997, Hassabis s'est rendu au Japon. En mai de la même année, l'ordinateur Deep Blue d'IBM a vaincu le champion du monde d'échecs Garry Kasparov. Pour la première fois, un ordinateur a battu un grand maître d'échecs. Le match a attiré l'attention du monde entier et soulevé des inquiétudes concernant la puissance croissante et la menace potentielle des ordinateurs. Lorsque Hassabis a rencontré le maître japonais des jeux de société Masahiko Fujuvarea, il lui a parlé d'un plan qui combine ses intérêts dans les jeux stratégiques et l'intelligence artificielle: un jour, il construira un programme informatique qui battra le plus grand joueur en jeu.
Hassabis a agi de manière méthodique: «À l'âge de 20 ans, Hassabis était d'avis que certaines choses devaient être en place avant de s'engager dans l'IA au niveau qu'il voulait», explique Matthews. "Il avait un plan."
En 1998, il a fondé son propre studio de jeux vidéo Elixir. Hassabis s'est concentré sur un jeu extrêmement ambitieux - Republic: The Revolution, un simulateur politique complexe. Il y a de nombreuses années, à l'école, Hassabis a dit à son ami Mustafa Suleiman que le monde avait besoin d'un simulateur grandiose pour simuler sa dynamique complexe et résoudre les problèmes sociaux les plus complexes. Maintenant, il a essayé de le faire dans le jeu.
L'intégration dans le cadre du jeu a été plus difficile qu'il ne l'avait prévu. Au final, Elixir a sorti une version raccourcie du jeu pour adoucir les critiques. D'autres jeux ont échoué (y compris un simulateur de méchant Bondian appelé Evil Genius). En avril 2005, Hassabis a fermé Elixir. Matthews estime que Hassabis a fondé l'entreprise simplement pour acquérir une expérience de gestion. Désormais, Demis n'avait besoin que d'un domaine de connaissances important pour commencer à travailler sur une IA puissante. Il avait besoin de comprendre le cerveau humain.
En 2005, Hassabis a obtenu un doctorat en neurosciences à l'University College London (UCL). Il a publié des études célèbres sur la mémoire et l'imagination. Un de ses articles, qui a depuis été cité plus de 1000 fois, a montré que les personnes amnésiques ont également de la difficulté à comprendre de nouvelles expériences, ce qui suggère qu'il existe un lien entre se souvenir et créer des images mentales. Hassabis a créé une représentation cérébrale adaptée à la tâche de création d'AGI. La plupart des travaux se résumaient à une question: comment le cerveau humain reçoit-il et préserve-t-il les concepts et les connaissances?
Hassabis a officiellement fondé DeepMind le 15 novembre 2010. Depuis lors, la mission de l'entreprise est restée inchangée: «résoudre l'intelligence», puis l'utiliser pour résoudre tout le reste. Comme Hassabis l'a déclaré aux participants du Singularity Summit, cela signifie traduire notre compréhension du fonctionnement du cerveau en logiciels pouvant utiliser les mêmes méthodes d'auto-apprentissage.
Hassabis comprend que la science n'a pas encore pleinement saisi l'essence de l'esprit humain. Un projet d'IA solide ne peut pas simplement être créé sur la base de centaines d'études neurobiologiques. Mais il croit clairement que l'on en sait déjà assez pour commencer à travailler sur une IA forte. Et pourtant, il est possible que sa confiance soit en avance sur la réalité. Nous savons encore très peu de choses sur le fonctionnement réel du cerveau. En 2018, les résultats de la propre thèse de Hassabis ont été remis en cause par une équipe de chercheurs australiens. Ce n'est qu'un article, mais il montre que les opinions scientifiques sous-jacentes à DeepMind sont loin d'être consensuelles.
L'entreprise a été co-fondée par Mustafa Suleiman et Shane Legge, un néo-zélandais AGI obsédé que Hassabis a également rencontré à l'UCL. La réputation de l'entreprise grandissait et Hassabis récoltait les fruits de son talent. «C'est comme un aimant», explique Ben Faulkner, ancien directeur des opérations chez DeepMind. De nombreux employés vivaient en Europe, loin des départements RH des géants de la Silicon Valley comme Google et Facebook. Peut-être que la principale réalisation de DeepMind a été l'embauche d'employés immédiatement après sa fondation, afin de trouver et de conserver les talents les plus brillants et les meilleurs dans le domaine de l'IA. L'entreprise a ouvert un bureau dans le grenier d'une maison de ville sur Russell Square à Bloomsbury, en face de l'UCL.
L'une des méthodes d'apprentissage automatique sur lesquelles la société s'est concentrée est née de la double passion de Hassabis pour les jeux et les neurosciences: l'apprentissage renforcé. Un tel programme est conçu pour collecter des informations sur l'environnement, puis les étudier, reproduisant à plusieurs reprises l'expérience acquise, comme l'activité du cerveau humain dans un rêve, comme Hassabis l'a dit dans sa conférence sur le Singularity Summit.
La formation de renforcement commence à partir de zéro. Le programme montre un environnement virtuel dont il ne connaît que les règles. Par exemple, une simulation d'un jeu d'échecs ou de jeux vidéo. Un programme contient au moins un composant appelé réseau de neurones. Il se compose de couches de structures de calcul qui filtrent les informations pour identifier des fonctions ou des stratégies spécifiques. Chaque couche explore l'environnement à un nouveau niveau d'abstraction. Au début, ces réseaux fonctionnent avec un succès minimal, mais il est important que chaque panne laisse une marque et soit codée au sein du réseau. Progressivement, le réseau neuronal devient plus sophistiqué, car il expérimente différentes stratégies - et reçoit une récompense s'il réussit. Si le programme déplace la pièce d'échecs et perd la partie, il ne répétera pas cette erreur. La majeure partie de la magie de l'intelligence artificielle est la vitesse à laquelle elle répète ses tâches.
Le point culminant du travail de DeepMind a été 2016, lorsque la société a lancé le programme AlphaGo, qui a utilisé la formation de renforcement ainsi que d'autres méthodes pour jouer au go. À la surprise générale, lors d'un duel de cinq matchs à Séoul, le programme a battu le champion du monde. 280 millions de téléspectateurs ont assisté à la victoire de la voiture: cet événement s'est produit une décennie plus tôt que ne l'avaient prédit les experts. L'année suivante, une version améliorée d'AlphaGo bat le champion chinois de go.
Comme Deep Blue en 1997, AlphaGo a changé la perception de ce qui constitue l'excellence humaine. Les champions des jeux de société, certains des esprits les plus brillants de la planète, n'étaient plus considérés comme le summum de l'intelligence. Près de 20 ans après une conversation avec le maître japonais Fujuwaraa, Hassabis a tenu sa promesse. Il a ensuite déclaré qu'il avait failli fondre en larmes pendant le match. Selon la tradition, l'élève de go remercie l'enseignant en le battant dans le match. Hassabis a remercié Matthews, battant tout le match.
DeepBlue a gagné grâce à la force brute et à la vitesse de calcul, mais le style d'AlphaGo semblait artistique, presque humain. Sa grâce et sa sophistication, la supériorité des muscles informatiques semblaient montrer que DeepMind allait plus loin que ses concurrents dans le développement d'un programme capable de traiter les maladies et de gérer les villes.
Hassabis a toujours dit que DeepMind changera le monde pour le mieux. Mais il n'y a aucune certitude sur une IA forte. S'il se présente, nous ne savons pas s'il sera altruiste ou malveillant, s'il obéira au contrôle humain. Même ainsi, qui va prendre le contrôle?
Dès le début, Hassabis a tenté de défendre l'indépendance de DeepMind. Il a toujours insisté pour que DeepMind reste à Londres. Lorsque Google a racheté l'entreprise en 2014, la question du contrôle est devenue plus pertinente. Hassabis n'était pas tenu de vendre l'entreprise. Il avait suffisamment d'argent et a décrit un modèle commercial par lequel la société développe des jeux pour financer la recherche. Les finances de Google avaient du poids, mais, comme de nombreux fondateurs, Hassabis ne voulait pas abandonner l'entreprise qu'il avait grandie. Dans le cadre de l'accord, DeepMind a conclu un accord qui empêcherait Google de prendre unilatéralement le contrôle de la propriété intellectuelle de l'entreprise.
Selon une personne avertie, avant la transaction, les parties ont signé un contrat appelé Accord d'éthique et de révision de la sécurité. L'accord, qui n'avait pas été signalé auparavant, a été rédigé par de sérieux avocats londoniens.L'accord transfère le contrôle de la technologie de base d'une IA forte à DeepMind chaque fois que cette IA est créée, à savoir un groupe de pilotage appelé le comité d'éthique. Selon la même source, le Conseil d'éthique n'est pas une concession cosmétique de Google. Il fournit à DeepMind un support juridique solide pour garder le contrôle de sa technologie la plus précieuse et potentiellement la plus dangereuse. Les noms des membres du conseil n'ont pas été rendus publics, mais une autre source proche de DeepMind et Google dit qu'elle comprend les trois fondateurs de DeepMind (la société a refusé de répondre aux questions sur l'accord, mais a déclaré que «le contrôle éthique des premiers jours était pour nous priorité ”).Hassabis peut déterminer le sort de DeepMind par d'autres moyens. L'un d'eux est la fidélité du personnel. Les employés passés et actuels affirment que le programme de recherche Hassabis est l'une des plus grandes forces de DeepMind. Son programme propose un travail fascinant et important, à l'abri de la pression des milieux académiques. Ces conditions ont attiré des centaines d'experts parmi les plus talentueux du monde. DeepMind possède des filiales à Paris et en Alberta. De nombreux employés se sentent plus proches de Hassabis et de sa mission que de la société mère qui a soif de revenus. Tant que Hassabis maintient sa fidélité personnelle, il a un pouvoir important sur son unique actionnaire. Pour Google, il est préférable que les talents de DeepMind travaillent pour elle par le biais d'un intermédiaire plutôt que sur Facebook ou Apple.DeepMind dispose d'un levier de plus, bien qu'il nécessite un réapprovisionnement constant: une publicité favorable. L'entreprise se porte bien. AlphaGo est devenu une véritable bombe PR. Depuis l'acquisition de Google, la société a produit à plusieurs reprises des miracles qui ont attiré l'attention du monde entier. Un programme DeepMind peut diagnostiquer les maladies oculaires en scannant la rétine. Un autre a appris à jouer aux échecs à partir de zéro en utilisant une architecture de style AlphaGo, devenant le plus grand joueur d'échecs de tous les temps en seulement neuf heures d'auto-apprentissage. En décembre 2018, un programme appelé AlphaFold a dépassé ses concurrents dans la tâche de prédire la structure tridimensionnelle des protéines à l'aide d'une liste de composants, ouvrant potentiellement la voie au traitement de maladies telles que la maladie de Parkinson et la maladie d'Alzheimer.DeepMind est particulièrement fier des algorithmes développés qui calculent les moyens de refroidissement les plus efficaces des centres de données Google, où environ 2,5 millions de serveurs fonctionnent. DeepMind a déclaré en 2016 avoir réduit les coûts énergétiques de Google de 40%. Mais certains initiés disent que c'est un chiffre exagéré. Google a utilisé des algorithmes pour optimiser les centres de données bien avant DeepMind: «Ils veulent juste que certains RP ajoutent de la valeur à Alphabet», explique un employé de Google. La société mère d'Alphabet, Google, paie généreusement DeepMind pour ces services. Ainsi, en 2017, DeepMind lui a facturé 54 millions de livres sterling. Ce chiffre est dérisoire par rapport aux dépenses actuelles de DeepMind: seulement 200 millions de dollars ont été dépensés pour le personnel cette année-là. En général, les pertes de DeepMind en 2017 se sont élevées à 282 millions de livres sterling.Ce sont des sous misérables pour le riche géant de l'Internet. Mais d'autres sociétés non rentables Alphabet ont attiré l'attention de Ruth Porat, la frugale directrice financière d'Alphabet. Par exemple, la division Google Fibre a tenté de créer un fournisseur de services Internet haute vitesse en exécutant des lignes de fibre optique vers des maisons privées. Mais le projet a été suspendu lorsqu'il est devenu clair qu'il faudrait des décennies pour restituer l'investissement. Par conséquent, il est important pour les chercheurs en IA de prouver leur pertinence afin de ne pas attirer le regard tenace de Mme Porat, dont le nom est déjà devenu un nom familier dans Alphabet.Les réalisations prévues de DeepMind dans l'IA font partie d'une stratégie de relation avec les propriétaires d'entreprise. DeepMind signale sa réputation. Cela est particulièrement important lorsque Google est accusé d'envahir la vie privée des utilisateurs et de diffuser de fausses nouvelles. DeepMind a également eu la chance d'avoir un supporter au plus haut niveau: Larry Page, l'un des deux fondateurs de Google, aujourd'hui PDG d'Alphabet. Page est ce que Hassabis a de plus proche de sa société mère. Le père de Page, Carl, a étudié les réseaux de neurones dans les années 60. Au début de sa carrière, Page a déclaré qu'il avait créé Google uniquement pour fonder la société d'intelligence artificielle.Un contrôle strict sur DeepMind, pour bien paraître aux yeux de la presse, ne correspond pas tout à fait à l'esprit académique qui imprègne l'entreprise. Certains chercheurs se plaignent qu'il leur est difficile de publier leur travail: ils doivent surmonter plusieurs niveaux de censure interne avant de pouvoir au moins soumettre un rapport pour la conférence ou un article pour la revue. DeepMind estime que vous devez faire attention à ne pas effrayer le public avec la perspective d'une IA forte. Mais un silence trop dense peut ruiner l'atmosphère académique et affaiblir la loyauté des employés.Cinq ans après l'acquisition de Google, la question de savoir qui contrôle DeepMind approche d'un point critique. Les fondateurs et les premiers employés de l’entreprise pourront bientôt partir avec leur compensation financière (les actions de Hassabis, probablement après l’achat de Google, valent environ 100 millions de livres sterling). Mais une source proche de la société suggère qu'Alphabet a reporté de deux ans la monétisation des options des fondateurs. Compte tenu de sa concentration constante sur la mission, Hassabis ne quittera probablement pas le navire. L'argent ne l'intéresse que dans la mesure où il contribue à atteindre l'objectif de toute sa vie. Mais certains collègues sont déjà partis. Depuis début 2019, trois ingénieurs en IA ont quitté l'entreprise. Et Ben Laurie, l'un des professionnels de la sécurité les plus célèbres au monde, est maintenant revenu chez Google, chez son ancien employeur. Ce nombre est petitAprès tout, DeepMind offre une mission si excitante et un salaire décent que peu de gens quittent.Jusqu'à présent, Google n'est pas intervenu dans DeepMind. Mais un événement récent a soulevé des inquiétudes quant à la durée pendant laquelle l'entreprise sera en mesure de maintenir son indépendance.
DeepMind a toujours prévu d'utiliser l'IA pour améliorer les soins de santé. En février 2016, une nouvelle division de DeepMind Health a été créée, dirigée par Mustafa Suleiman, l'un des co-fondateurs. Suleiman, dont la mère travaillait comme infirmière au National Health Service (NHS), espérait créer un programme appelé Streams qui alerterait les médecins lorsque la santé d'un patient se détériore. DeepMind devait gagner sur chaque opération efficace du système. Parce que ce travail nécessitait l'accès à des informations confidentielles sur les patients, Suleiman a créé le Independent Review Panel (IRP), qui comprenait des représentants des secteurs britanniques de la santé et de la technologie. DeepMind a agi très soigneusement. Par la suite, le British Information Commissioner a découvertque l'un des hôpitaux partenaires a violé la loi lors du traitement des données des patients. Cependant, fin 2017, Suleiman avait signé des accords avec quatre grands hôpitaux du NHS.Le 8 novembre 2018, Google a annoncé la création de sa propre division de Google Health. Cinq jours plus tard, ils ont annoncé que DeepMind Health devrait être inclus dans l'unité parentale. Apparemment, DeepMind n'a averti personne. Selon les documents que nous avons reçus sur demande conformément à la loi sur la liberté de l'information, DeepMind a notifié les hôpitaux partenaires de ce changement en seulement trois jours. La société a refusé de faire rapport lorsque les discussions sur la fusion ont commencé, mais a déclaré que le court intervalle entre l'avis et l'annonce publique était dans l'intérêt de la transparence. Suleiman a écrit en 2016 qu '"à aucun moment les données des patients ne seront jamais associées ou associées à des comptes, produits ou services Google". Il semble que sa promesse ait été rompue. (Répondant aux questions de notre publication, DeepMind a déclaréqu'à ce stade, aucun de nos contrats n'est passé à Google, et cela n'est possible qu'avec le consentement de nos partenaires. Le fait que Streams soit devenu un service Google ne signifie pas que les données des patients ... peuvent être utilisées dans d'autres produits ou services Google. ")L'annexion de Google a mis en colère les employés de DeepMind Health. Selon des personnes proches de cette unité, à la fin de la reprise, de nombreux employés prévoient de quitter. L'un des membres de l'IRP, Mike Bracken, est déjà parti. Selon plusieurs personnes proches de l'événement, Bracken est parti en décembre 2017 par crainte que la «commission de contrôle» soit plus une vitrine qu'un véritable oubli. Lorsque Bracken a demandé à Suleiman s'il serait responsable devant la commission et égaliserait leurs pouvoirs avec les administrateurs non exécutifs, Suleiman ne fit que sourire. (Un porte-parole de DeepMind a déclaré qu'il «ne se souvient pas» d'un tel incident.) Julian Huppert, le chef de l'IRP, soutient que le groupe a fourni «une gouvernance plus radicale» que Brecken ne s'y attendait, car les membres pouvaient s'exprimer ouvertement et n'étaient pas liés par un devoir de confidentialité.Cet épisode révèle que les unités périphériques de DeepMind sont vulnérables à Google. La déclaration de DeepMind a déclaré: "Nous avons tous convenu qu'il est logique de combiner ces efforts dans un seul projet commun avec une ressource plus puissante." La question est de savoir si Google appliquerait la même logique au travail de DeepMind sur l'IA forte.De l'extérieur, il semble que DeepMind ait remporté un grand succès. Elle a déjà développé un logiciel capable d'apprendre à accomplir des tâches à un niveau surhumain. Hassabis mentionne souvent Breakout, un jeu vidéo pour la console Atari. Le joueur Breakout contrôle la plate-forme en bas de l'écran et reflète la balle qui rebondit sur les blocs en haut, s'effondrant sous le coup. Le joueur gagne lorsque tous les blocs sont détruits. Perd s'il manque le ballon. Sans instructions humaines, le programme DeepMind a non seulement appris à jouer au jeu, mais a également développé une stratégie pour lancer la balle dans l'espace au-dessus des blocs, où elle saute pendant longtemps et gagne un tas de points sans effort de la part du joueur. Selon Hassabis, cela démontre la puissance de l'apprentissage renforcé et les capacités paranormales des programmes informatiques DeepMind.Une démonstration impressionnante. Mais Hassabis manque quelque chose. Si vous déplacez la plate-forme virtuelle d'au moins quelques pixels vers le haut, le programme échouera. La compétence acquise par DeepMind est si limitée qu'elle ne peut même pas répondre à de minuscules changements environnementaux que les gens peuvent prendre en compte - du moins pas sans des milliers de séances d'entraînement supplémentaires. Mais de tels changements font partie intégrante de la réalité environnante. Il n'y a pas deux organes identiques du corps pour le diagnosticien. Pour un mécanicien, deux moteurs ne peuvent pas être configurés de manière égale. Par conséquent, les systèmes formés dans l'espace virtuel peuvent rencontrer des difficultés lors du démarrage dans des conditions réelles.Le deuxième hic, dont DeepMind parle rarement, est que le succès dans les environnements virtuels dépend d'une fonction de récompense: un signal qui permet à un réseau de neurones de mesurer sa progression. Le programme voit que plusieurs rebonds du mur arrière augmentent le score. Un élément clé du développement d'AlphaGo a été la création d'une fonction de récompense compatible avec un jeu aussi complexe. Malheureusement, le monde réel n'offre pas de simples récompenses. Les progrès sont rarement mesurés par des points individuels. Même s'ils existent, la tâche est compliquée par des problèmes politiques. Régler le signal de récompense pour améliorer le climat (concentration de CO₂ dans l'atmosphère) contredit le signal de récompense pour les compagnies pétrolières (cours de bourse) et nécessite un compromis avec de nombreuses personnes aux motivations conflictuelles. Les signaux de récompense sont généralement très faibles.Le cerveau humain reçoit rarement une rétroaction claire sur le succès d'une tâche lors de son exécution.
DeepMind a trouvé un moyen efficace d'apprendre en utilisant une énorme quantité de ressources informatiques. Le programme AlphaGo a étudié pendant des milliers d'années de temps de jeu avant de comprendre quelque chose. De nombreux experts en IA soupçonnent que cette méthode ne fonctionnera pas pour les tâches qui offrent des récompenses plus faibles. DeepMind reconnaît le problème. Elle s'est récemment concentrée sur StarCraft 2, un jeu informatique stratégique. Les décisions prises au début du jeu ont des conséquences beaucoup plus tardives, ce qui est plus proche des commentaires confus et tardifs dans le monde réel. En janvier, DeepMind a battu certains des meilleurs joueurs du monde dans une version de démonstration, qui, bien que très limitée, était toujours impressionnante. Ses programmes ont également commencé à étudier les fonctions de récompense, en tenant compte des commentaires d'un enseignant humain. Mais en employant un enseignant, vous courez le risque de perdre les économies d'échelle et de vitesse offertes par le traitement informatique pur.
Des chercheurs actuels et anciens de DeepMind et de Google, qui ont demandé à rester anonymes en raison d'accords de non-divulgation stricts, ont également exprimé leur scepticisme quant à l'utilisation de ces méthodes, DeepMind peut créer une IA solide. Selon eux, l'accent mis sur les hautes performances dans les environnements virtuels rend difficile la résolution du problème avec le signal de récompense. Pourtant, une approche de jeu est au cœur de DeepMind. La société dispose d'un classement interne où les programmes des équipes de programmation concurrentes rivalisent pour les domaines virtuels.
Hassabis a toujours perçu la vie comme un jeu. La majeure partie de sa carrière est consacrée au développement de jeux, et la plupart de son temps libre est consacré à la pratique du jeu. Chez DeepMind, il a choisi les jeux comme son principal moyen de construire une IA forte. Comme son logiciel, Hassabis ne peut apprendre que de sa propre expérience. Les gens peuvent oublier la tâche initiale, car DeepMind a déjà inventé des technologies médicales utiles et a dépassé les plus grands joueurs de la classe des jeux de société. Ce sont des réalisations importantes, mais pas celles dont le fondateur de l'entreprise a envie. Cependant, il a encore une chance de créer une IA solide sous le nez de Google, mais hors du contrôle de la société. Si cela réussit, Demis Hassabis remportera le match le plus difficile.