Demis Hassabis fundó la compañía para crear la IA más poderosa del mundo. Luego fue comprado por GoogleEn agosto de 2010, un londinense de 34 años llamado Demis Hassabis subió al escenario en una sala de conferencias en un suburbio de San Francisco. Salió con un paso tranquilo de un hombre que estaba tratando de controlar sus nervios, frunció los labios con una breve sonrisa y comenzó: "Entonces, hoy hablaremos sobre diferentes enfoques para el desarrollo ...", dudó, como si de repente se diera cuenta de que estaba expresando pensamientos ambiciosos secretos. Pero luego dijo: "... una IA fuerte".
La IA fuerte (inteligencia general artificial o AGI) significa inteligencia artificial universal: un programa informático hipotético capaz de realizar tareas intelectuales como persona o incluso mejor. Una IA fuerte podrá realizar tareas individuales, como reconocimiento de fotos o traducción de texto, que son las únicas tareas de cada una de las IA débiles en nuestros teléfonos y computadoras. Pero también jugará ajedrez y hablará francés. Entenderá artículos sobre física, compondrá novelas, desarrollará estrategias de inversión y mantendrá conversaciones encantadoras con extraños. Supervisará las reacciones nucleares, gestionará las redes eléctricas y los flujos de tráfico y, sin mucho esfuerzo, tendrá éxito en todo lo demás. AGI hará que la IA más avanzada de hoy parezca una calculadora de bolsillo.
La única inteligencia que actualmente es capaz de realizar todas estas tareas es aquella con la que las personas están dotadas. Pero la inteligencia humana está limitada por el tamaño del cráneo. La fuerza de nuestro cerebro está limitada por la cantidad insignificante de energía que el cuerpo puede proporcionar. Debido a que AGI se ejecuta en computadoras, no sufrirá ninguna de estas limitaciones. La inteligencia fuerte está limitada solo por la cantidad de procesadores disponibles. Puede comenzar por monitorear las reacciones nucleares. Pero abrirá rápidamente nuevas fuentes de energía, digiriendo más trabajo científico en física por segundo de lo que una persona puede hacer en mil vidas. La inteligencia humana, combinada con la velocidad y escalabilidad de las computadoras, hará desaparecer los problemas que actualmente parecen insolubles. En una entrevista con British
Observer, Hassabis dijo que, entre otras cosas, una IA fuerte necesita dominar tales disciplinas y resolver problemas tales como "cáncer, cambio climático, energía, genómica, macroeconomía [y] sistemas financieros".
La conferencia de Hassabis se llamó Singularity Summit. Según los futurólogos, la singularidad es una de las consecuencias más probables de la aparición de AGI. Como procesa la información a alta velocidad, se vuelve más sabia muy rápidamente. Los ciclos rápidos de superación personal conducirán a una explosión de inteligencia de máquina, dejando a las personas muy atrasadas con el polvo de silicio. Dado que este futuro está completamente construido sobre la base de suposiciones no verificadas, la cuestión de si la singularidad se considera utopía o infierno es casi religiosa.
A juzgar por los nombres de las conferencias en la conferencia, los participantes gravitan hacia el mesianismo: "Razón y cómo construirlo"; "La IA como solución al problema del envejecimiento"; "Reemplazo de nuestros cuerpos"; "Cambiar el límite entre la vida y la muerte". La conferencia de Hassabis, por otro lado, no parece muy impresionante: "Un enfoque neurobiológico sistémico para construir un AGI".
Hassabis camina entre el podio y la pantalla, diciendo algo rápidamente. Lleva un cárdigan marrón y una camisa blanca con botones, como un niño de escuela. Parece que un pequeño crecimiento solo fortalece su inteligencia. Hasta ahora, explicó Hassabis, los científicos se han acercado a AGI desde dos lados. En el campo de la IA simbólica, los investigadores trataron de describir y programar todas las reglas para un sistema que podría pensar como una persona. Este enfoque fue popular en los años 80-90, pero no dio los resultados deseados. Hassabis cree que la estructura mental del cerebro es demasiado sofisticada para ser descrita de esta manera.
Los investigadores que intentaron reproducir las redes físicas del cerebro en forma digital trabajaron en otra área. Esto tenía un significado definido. Después de todo, el cerebro es el receptáculo de la inteligencia humana. Pero estos investigadores fueron engañados, dijo Hassabis. Su tarea resultó ser aproximadamente de la misma escala que un intento de mapear todas las estrellas en el universo. Además, se centra en el nivel equivocado. Es como tratar de entender cómo funciona Microsoft Excel desmontando una computadora y estudiando las interacciones de transistores.
En cambio, Hassabis propuso un término medio: una IA fuerte debería inspirarse en los amplios métodos por los cuales el cerebro procesa la información, y no en los sistemas físicos o las reglas específicas que aplica en situaciones específicas. En otras palabras, los científicos deberían centrarse en comprender el software del cerebro, no su hardware. Los nuevos métodos, como la resonancia magnética funcional, le permiten mirar dentro del cerebro durante su actividad. Hacen posible tal comprensión. Estudios recientes han demostrado que el cerebro aprende en un sueño, reproduciendo las experiencias recibidas para derivar principios generales. Los investigadores de IA deben emular este sistema.
En la esquina inferior derecha de la diapositiva apareció un logotipo: un remolino azul redondo. Debajo hay dos palabras: DeepMind. Esta fue la primera mención pública de una nueva empresa.

Hassabis pasó un año entero tratando de obtener una invitación a Singularity Summit. La conferencia fue solo una tapadera. Lo que realmente necesitaba era un minuto con Peter Thiel, el multimillonario de Silicon Valley que patrocinó la conferencia. Hassabis quería su inversión.
Hassabis nunca dijo por qué buscó obtener el apoyo de Thiel precisamente (para este artículo, rechazó varias solicitudes de entrevistas a través de un portavoz). Hablamos con 25 fuentes, incluidos empleados e inversores actuales y anteriores. La mayoría de ellos hablaron anónimamente porque no tenían derecho a hablar sobre la compañía. Pero Thiel cree en AGI con mayor fervor que Hassabis. En un discurso en 2009, Thiel dijo que su mayor temor por el futuro no es un levantamiento robótico (aunque en Nueva Zelanda, aislado del mundo entero, está mejor protegido que la mayoría de las personas). Más bien, teme que la singularidad llegue demasiado tarde. El mundo necesita nuevas tecnologías para evitar una recesión económica.
Finalmente, DeepMind recibió £ 2 millones en fondos de capital de riesgo; incluyendo £ 1.4 millones de Thiel. Cuando Google compró la compañía en enero de 2014 por $ 600 millones, los primeros inversores registraron una ganancia del 5,000%.
Para muchos fundadores, este sería un final feliz. Puede reducir la velocidad, dar un paso atrás y disfrutar del dinero. Para Hassabis, el acuerdo con Google fue otro paso en su búsqueda de una IA fuerte. Pasó casi todo el 2013 en negociaciones sobre el acuerdo. DeepMind actuará por separado de la empresa matriz. Hassabis recibirá todos los privilegios corporativos, como el acceso al flujo de efectivo y el poder de procesamiento, sin perder el control de la empresa.
Hassabis pensó que DeepMind sería un híbrido: tendría una unidad de arranque, el cerebro de las mejores universidades y los bolsillos profundos de una de las empresas más ricas del mundo. Todo se hizo para acelerar el desarrollo de una IA fuerte y ayudar a la humanidad.
Demis Hassabis nació en el norte de Londres en 1976 en la familia de un grecochipriota y un chino-singapurense. Era el mayor de tres hermanos y hermanas. Mamá trabajaba en los grandes almacenes John Lewis y su padre trabajaba en una juguetería. El niño aprendió a jugar ajedrez a la edad de cuatro años, viendo el juego de su padre y su tío. Después de algunas semanas, los adultos ya no podían vencerlo. A la edad de 13 años, Demis se convirtió en el segundo jugador de ajedrez del mundo a su edad. A los ocho años, aprendió independientemente a programar.
En 1992, Hassabis se graduó de la escuela dos años antes de lo previsto. Obtuvo un trabajo programando videojuegos en Bullfrog Productions, donde escribió el juego Theme Park. En él, los jugadores construyeron y administraron un parque de atracciones virtual. El juego tuvo mucho éxito con 15 millones de copias vendidas. Pertenecía a un nuevo género de simuladores, en el que el objetivo no es derrotar al enemigo, sino optimizar el funcionamiento de un sistema tan complejo como un negocio o una ciudad.
Parque temático para Android, 2018Demis no solo desarrolló juegos, sino que también jugó grandes juegos. Cuando era adolescente, se debatía entre competencias en ajedrez, scrabble, póker y backgammon. En 1995, mientras estudiaba informática en la Universidad de Cambridge, Hassabis se metió en un torneo de estudiantes. Este es un antiguo juego de estrategia de mesa, que es mucho más complicado que el ajedrez. Se supone que el dominio requiere intuición adquirida a través de una larga experiencia. Nadie sabía si Hassabis había jugado antes.
Primero, Hassabis ganó el torneo para principiantes. Luego venció al ganador del torneo para jugadores experimentados, aunque con una desventaja. Organizador del torneo, el maestro de Cambridge Charles Matthews recuerda la conmoción de un jugador experimentado después de perder ante un novato de 19 años. Matthews tomó a Hassabis bajo su cuidado.
La inteligencia y las ambiciones de Hassabis siempre han sido evidentes en los juegos. Los juegos, a su vez, despertaron su interés en la inteligencia. Al observar su progreso en el ajedrez, se preguntó: ¿es posible programar computadoras para que aprendan como él, basándose en la experiencia? Los juegos ofrecían un entorno de aprendizaje que el mundo real no podía igualar. Eran claros y autosuficientes. Dado que los juegos están separados de la realidad, se pueden practicar sin interferir con el mundo real y dominarlos de manera efectiva. Los juegos aceleran el tiempo: en un par de días puedes crear un sindicato criminal, y la batalla en el Somme termina en cuestión de minutos.
En el verano de 1997, Hassabis viajó a Japón. En mayo de ese año, la computadora Deep Blue de IBM derrotó al campeón mundial de ajedrez Garry Kasparov. Por primera vez, una computadora venció a un gran maestro de ajedrez. El partido atrajo la atención mundial y generó preocupaciones sobre el creciente poder y la amenaza potencial de las computadoras. Cuando Hassabis se reunió con el maestro japonés de juegos de mesa Masahiko Fuzuvarea, le contó sobre un plan que combina sus intereses en juegos estratégicos e inteligencia artificial: un día construirá un programa de computadora que derrotará al mejor jugador en marcha.
Hassabis actuó metódicamente: "A la edad de 20 años, Hassabis era de la opinión de que ciertas cosas deben estar en su lugar antes de involucrarse en la IA al nivel que quería", dice Matthews. "Tenía un plan".
En 1998, fundó su propio estudio de juegos Elixir. Hassabis se centró en un juego extremadamente ambicioso: Republic: The Revolution, un complejo simulador político. Hace muchos años, en la escuela, Hassabis le dijo a su amigo Mustafa Suleiman que el mundo necesitaba un simulador grandioso para simular su dinámica compleja y resolver los problemas sociales más complejos. Ahora trató de hacerlo en el juego.
Encajar en el marco del juego fue más difícil de lo que esperaba. Al final, Elixir lanzó una versión abreviada del juego para suavizar las reseñas. Otros juegos han fallado (incluido un simulador de villano Bondian llamado Evil Genius). En abril de 2005, Hassabis cerró Elixir. Matthews cree que Hassabis fundó la compañía simplemente para obtener experiencia gerencial. Ahora, Demis solo necesitaba un área importante de conocimiento para comenzar a trabajar en una IA fuerte. Necesitaba entender el cerebro humano.
En 2005, Hassabis obtuvo un doctorado en neurociencia en el University College London (UCL). Publicó estudios famosos de memoria e imaginación. Uno de sus artículos, que desde entonces ha sido citado más de 1,000 veces, mostró que las personas con amnesia también tienen dificultades para comprender nuevas experiencias, lo que sugiere que existe una conexión entre recordar y crear imágenes mentales. Hassabis creó una representación cerebral adecuada para la tarea de crear AGI. La mayor parte del trabajo se redujo a una pregunta: ¿cómo recibe y preserva el cerebro humano los conceptos y el conocimiento?
Hassabis fundó oficialmente DeepMind el 15 de noviembre de 2010. Desde entonces, la misión de la compañía no ha cambiado: "resolver la inteligencia" y luego usarla para resolver todo lo demás. Como Hassabis dijo a los participantes de la Cumbre de Singularity, esto significa traducir nuestra comprensión de cómo funciona el cerebro en software que puede usar los mismos métodos de autoaprendizaje.
Hassabis comprende que la ciencia aún no ha captado completamente la esencia de la mente humana. Un proyecto de IA fuerte no puede simplemente crearse sobre la base de cientos de estudios neurobiológicos. Pero él cree claramente que ya se sabe lo suficiente como para comenzar a trabajar en una IA fuerte. Y, sin embargo, existe la posibilidad de que su confianza esté por delante de la realidad. Todavía sabemos muy poco cómo funciona realmente el cerebro. En 2018, un equipo de investigadores australianos cuestionó los resultados de la propia tesis doctoral de Hassabis. Este es solo un artículo, pero muestra que las opiniones científicas que subyacen a DeepMind están lejos de ser consensuadas.
La compañía fue cofundada por Mustafa Suleiman y Shane Legge, un neozelandés obsesivo de AGI a quien Hassabis también conoció en UCL. La reputación de la compañía estaba creciendo y Hassabis estaba cosechando los beneficios de su talento. "Es como un imán", dice Ben Faulkner, ex gerente de operaciones de DeepMind. Muchos empleados vivían en Europa, lejos de los departamentos de recursos humanos de los gigantes de Silicon Valley como Google y Facebook. Quizás el principal logro de DeepMind fue la contratación de empleados justo después de su fundación para encontrar y retener los mejores y más brillantes talentos en el campo de la IA. La compañía abrió una oficina en el ático de una casa en Russell Square en Bloomsbury, al otro lado de la calle de UCL.
Uno de los métodos de aprendizaje automático en el que la compañía se ha centrado ha surgido de la doble pasión de Hassabis por los juegos y la neurociencia: el aprendizaje reforzado. Tal programa está diseñado para recopilar información sobre el medio ambiente y luego estudiarlo, reproduciendo repetidamente la experiencia adquirida, como la actividad del cerebro humano en un sueño, como dijo Hassabis en su conferencia sobre Singularity Summit.
El entrenamiento de refuerzo comienza desde cero. El programa muestra un entorno virtual sobre el cual no conoce nada más que las reglas. Por ejemplo, una simulación de un juego de ajedrez o videojuegos. Un programa contiene al menos un componente conocido como red neuronal. Consiste en capas de estructuras computacionales que tamizan la información para identificar funciones o estrategias específicas. Cada capa explora el entorno en un nuevo nivel de abstracción. Al principio, estas redes operan con un éxito mínimo, pero es importante que cada falla deje una marca y se codifique dentro de la red. Poco a poco, la red neuronal se está volviendo más sofisticada, ya que está experimentando con diferentes estrategias, y recibe una recompensa si tiene éxito. Si el programa mueve la pieza de ajedrez y, como resultado, pierde el juego, no repetirá este error. La mayor parte de la magia de la inteligencia artificial es la velocidad a la que repite sus tareas.
La culminación del trabajo de DeepMind fue 2016, cuando la compañía lanzó el programa AlphaGo, que utilizaba entrenamiento de refuerzo junto con otros métodos para jugar. Para sorpresa de todos, en un duelo de cinco partidos en Seúl, el programa venció al campeón mundial. 280 millones de espectadores vieron la victoria del automóvil: este evento ocurrió una década antes de lo que predijeron los expertos. Al año siguiente, una versión mejorada de AlphaGo derrotó al campeón chino de go.
Al igual que Deep Blue en 1997, AlphaGo ha cambiado la percepción de lo que constituye la excelencia humana. Los campeones de juegos de mesa, algunas de las mentes más brillantes del planeta, ya no se consideraban el pináculo de la inteligencia. Casi 20 años después de una conversación con el maestro japonés Fujuwaraa, Hassabis cumplió su promesa. Más tarde dijo que casi se echó a llorar durante el partido. Según la tradición, el estudiante que va le agradece al maestro al derrotarlo en el partido. Hassabis agradeció a Matthews, derrotando todo el juego.
DeepBlue ganó gracias a la fuerza bruta y la velocidad computacional, pero el estilo de AlphaGo parecía artístico, casi humano. Su gracia y sofisticación, la superioridad de los músculos computacionales parecían mostrar que DeepMind avanzó más que sus competidores en el desarrollo de un programa que podía tratar enfermedades y administrar ciudades.
Hassabis siempre ha dicho que DeepMind cambiará el mundo para mejor. Pero no hay certeza sobre una IA fuerte. Si alguna vez surge, no sabemos si será altruista o malicioso, si se someterá al control humano. Aun así, ¿quién tomará el control?
Desde el principio, Hassabis intentó defender la independencia de DeepMind. Siempre insistió en que DeepMind se quedara en Londres. Cuando Google compró la compañía en 2014, el tema del control se hizo más relevante. Hassabis no estaba obligado a vender la empresa. Tenía suficiente dinero y describió un modelo de negocio mediante el cual la compañía desarrolla juegos para financiar la investigación. Las finanzas de Google tenían peso, pero, como muchos fundadores, Hassabis no quería renunciar a la compañía que había crecido. Como parte del acuerdo, DeepMind celebró un acuerdo que evitaría que Google tome el control unilateral de la propiedad intelectual de la compañía.
Según una persona informada, antes de la transacción, las partes firmaron un contrato denominado Acuerdo de revisión de ética y seguridad. El acuerdo, que no se informó anteriormente, fue elaborado por abogados serios de Londres.El acuerdo transfiere el control de la tecnología central de una IA fuerte a DeepMind cada vez que se crea esa IA, es decir, un grupo directivo llamado Junta de Ética. Según la misma fuente, el Consejo de Ética no es una concesión cosmética de Google. Brinda a DeepMind un sólido respaldo legal para mantener el control de su tecnología más valiosa y potencialmente más peligrosa. Los nombres de los miembros del consejo no se hicieron públicos, pero otra fuente cercana a DeepMind y Google dice que incluye a los tres fundadores de DeepMind (la compañía se negó a responder preguntas sobre el acuerdo, pero dijo que “el control ético desde los primeros días fue para nosotros prioridad ").Hassabis puede determinar el destino de DeepMind de otras maneras. Uno de ellos es la lealtad del personal. Los empleados anteriores y actuales dicen que el programa de investigación de Hassabis es una de las mayores fortalezas de DeepMind. Su programa ofrece un trabajo fascinante e importante, libre de la presión de los círculos académicos. Tales condiciones atrajeron a cientos de los expertos más talentosos del mundo. DeepMind tiene filiales en París y Alberta. Muchos empleados se sienten más cercanos a Hassabis y su misión que a la corporación matriz que ansía ingresos. Mientras Hassabis mantenga su lealtad personal, tendrá un poder significativo sobre su único accionista. Para Google, es mejor que los talentos de DeepMind trabajen para ella a través de un intermediario que se van a Facebook o Apple.DeepMind tiene una palanca más, aunque requiere una reposición constante: publicidad favorable. La compañía está bien. AlphaGo se ha convertido en una verdadera bomba de relaciones públicas. Desde la adquisición de Google, la compañía ha producido repetidamente milagros que han atraído la atención mundial. Un programa de DeepMind puede diagnosticar enfermedades oculares al escanear la retina. Otro aprendió a jugar ajedrez desde cero utilizando la arquitectura de estilo AlphaGo, convirtiéndose en el mejor jugador de ajedrez de todos los tiempos en solo nueve horas de autoaprendizaje. En diciembre de 2018, un programa llamado AlphaFold superó a sus competidores en la tarea de predecir la estructura tridimensional de las proteínas utilizando una lista de componentes, lo que podría allanar el camino para el tratamiento de enfermedades como la enfermedad de Parkinson y el Alzheimer.DeepMind está particularmente orgulloso de los algoritmos desarrollados que calculan los medios de enfriamiento más efectivos de los centros de datos de Google, donde se ejecutan aproximadamente 2.5 millones de servidores. DeepMind dijo en 2016 que redujeron los costos de energía de Google en un 40%. Pero algunos expertos dicen que esta es una figura exagerada. Google utilizó algoritmos para optimizar los centros de datos mucho antes de DeepMind: "Solo quieren que algunas relaciones públicas agreguen valor a Alphabet", dice un empleado de Google. La empresa matriz de Alphabet, Google, paga generosamente a DeepMind por dichos servicios. Entonces, en 2017, DeepMind le facturó £ 54 millones. Esta cifra palidece en comparación con los gastos actuales de DeepMind: solo se gastaron $ 200 millones en personal ese año. En general, las pérdidas de DeepMind en 2017 ascendieron a £ 282 millones.Estos son centavos miserables para el rico gigante de Internet. Pero otras compañías no rentables Alphabet atrajeron la atención de Ruth Porat, la directora financiera frugal de Alphabet. Por ejemplo, la división Google Fiber trató de crear un proveedor de servicios de Internet de alta velocidad ejecutando líneas de fibra óptica en hogares privados. Pero el proyecto se suspendió cuando quedó claro que tomaría décadas devolver la inversión. Por lo tanto, es importante que los investigadores de IA demuestren su relevancia para no atraer la mirada tenaz de la Sra. Porat, cuyo nombre ya se ha convertido en un nombre familiar en Alphabet.Los logros planificados de DeepMind en IA son parte de una estrategia de relación con los propietarios de la compañía. DeepMind señala su reputación. Esto es especialmente importante cuando Google es acusado de invadir la privacidad del usuario y difundir noticias falsas. DeepMind también tuvo la suerte de tener un seguidor al más alto nivel: Larry Page, uno de los dos fundadores de Google, ahora CEO de Alphabet. Page es lo más cercano que Hassabis tiene a su empresa matriz. El padre de Page, Carl, estudió redes neuronales en los años 60. Al comienzo de su carrera, Page dijo que creó Google únicamente para fundar la compañía de inteligencia artificial.El control estricto sobre DeepMind, para verse bien a los ojos de la prensa, no coincide con el espíritu académico que impregna la empresa. Algunos investigadores se quejan de que les es difícil publicar su trabajo: tienen que superar varios niveles de censura interna antes de que al menos puedan presentar un informe para la conferencia o un artículo para la revista. DeepMind cree que debes tener cuidado de no asustar al público ante la perspectiva de una IA fuerte. Pero un silencio demasiado denso puede arruinar la atmósfera académica y debilitar la lealtad de los empleados.Cinco años después de la adquisición de Google, la cuestión de quién controla DeepMind se está acercando a un punto crítico. Los fundadores y primeros empleados de la compañía pronto podrán irse con su compensación financiera (las acciones de Hassabis, probablemente después de la compra de Google valen alrededor de £ 100 millones). Pero una fuente cercana a la compañía sugiere que Alphabet ha pospuesto la monetización de las opciones de los fundadores por dos años. Dado su enfoque implacable en la misión, es poco probable que Hassabis abandone el barco. El dinero solo le interesa en la medida en que ayuda a alcanzar el objetivo de toda su vida. Pero algunos colegas ya se han ido. Desde principios de 2019, tres ingenieros de IA han abandonado la empresa. Y Ben Laurie, uno de los profesionales de seguridad más famosos del mundo, ahora ha regresado a Google, a su empleador anterior. Este número es pequeñoDespués de todo, DeepMind ofrece una misión tan emocionante y un salario decente que pocos se van.Hasta ahora, Google no ha intervenido en DeepMind. Pero un evento reciente suscitó preocupación sobre cuánto tiempo la compañía podrá mantener la independencia.
DeepMind siempre ha planeado usar IA para mejorar la atención médica. En febrero de 2016, se creó una nueva división de DeepMind Health, dirigida por Mustafa Suleiman, uno de los cofundadores. Suleiman, cuya madre trabajaba como enfermera en el Servicio Nacional de Salud (NHS), esperaba crear un programa llamado Streams que alertaría a los médicos cuando la salud de un paciente empeora. DeepMind tuvo que ganar en cada operación efectiva del sistema. Dado que este trabajo requería acceso a información confidencial del paciente, Suleiman estableció el Panel de Revisión Independiente (IRP), que incluía representantes de los sectores de tecnología y atención médica británicos. DeepMind actuó con mucho cuidado. Posteriormente, el Comisionado de Información británico descubrióque uno de los hospitales asociados violó la ley al procesar datos de pacientes. Sin embargo, a fines de 2017, Suleiman había firmado acuerdos con cuatro hospitales principales del NHS.El 8 de noviembre de 2018, Google anunció la creación de su propia división de Google Health. Cinco días después, anunciaron que DeepMind Health debería incluirse en la unidad para padres. Aparentemente, DeepMind no advirtió a nadie. De acuerdo con los documentos que recibimos a pedido de conformidad con la Ley de Libertad de Información, DeepMind notificó a los hospitales asociados de este cambio en solo tres días. La compañía declinó informar cuando comenzaron las discusiones sobre la fusión, pero dijo que la brecha entre el aviso y el anuncio público era de interés para la transparencia. Suleiman escribió en 2016 que "en ningún momento los datos del paciente se asociarán con cuentas, productos o servicios de Google". Parece que su promesa se rompió. (Respondiendo preguntas de nuestra publicación, dijo DeepMindque "en esta etapa, ninguno de nuestros contratos fue a Google, y esto es posible solo con el consentimiento de nuestros socios. El hecho de que Streams se haya convertido en un servicio de Google no significa que los datos del paciente ... puedan usarse en otros productos o servicios de Google ".La anexión de Google enfureció a los empleados de DeepMind Health. Según las personas cercanas a esta unidad, al finalizar la adquisición, muchos empleados planean renunciar. Uno de los miembros del IRP, Mike Bracken, ya se fue. Según varias personas familiarizadas con el evento, Bracken se fue en diciembre de 2017 debido al temor de que la "comisión de control" sea más un escaparate que una verdadera supervisión. Cuando Bracken le preguntó a Suleiman si sería responsable ante la comisión y equipararía sus poderes con los directores no ejecutivos, Suleiman solo sonrió. (Un portavoz de DeepMind dijo que "no recuerda" sobre tal incidente). Julian Huppert, jefe del IRP, afirma que el grupo proporcionó "una gobernanza más radical" de lo que Brecken esperaba, ya que los miembros podían hablar abiertamente y no estaban obligados por un deber de confidencialidad.Este episodio revela que las unidades periféricas de DeepMind son vulnerables a Google. La declaración de DeepMind decía: "Todos estuvimos de acuerdo en que tiene sentido combinar estos esfuerzos en un solo proyecto conjunto con un recurso más poderoso". La pregunta es si Google aplicaría la misma lógica al trabajo de DeepMind en una IA fuerte.Desde el exterior, parece que DeepMind ha logrado un gran éxito. Ella ya ha desarrollado un software capaz de aprender a completar tareas en un nivel sobrehumano. Hassabis a menudo menciona Breakout, un videojuego para la consola Atari. El jugador Breakout controla la plataforma en la parte inferior de la pantalla y refleja la pelota que rebota en los bloques en la parte superior, colapsando por el golpe. El jugador gana cuando se destruyen todos los bloques. Pierde si pierde la pelota. Sin instrucciones humanas, el programa DeepMind no solo aprendió a jugar el juego, sino que también desarrolló una estrategia para lanzar la pelota al espacio sobre los bloques, donde salta durante mucho tiempo y gana muchos puntos sin esfuerzo por parte del jugador. Según Hassabis, esto demuestra el poder del aprendizaje reforzado y las habilidades paranormales de los programas de computadora DeepMind.Una demostración impresionante. Pero a Hassabis le falta algo. Si mueve la plataforma virtual al menos un par de píxeles hacia arriba, el programa fallará. La habilidad adquirida por DeepMind es tan limitada que ni siquiera puede responder a pequeños cambios ambientales que las personas pueden tener en cuenta, al menos no sin miles de rondas de entrenamiento adicionales. Pero tales cambios son una parte integral de la realidad circundante. No hay dos órganos idénticos del cuerpo para el diagnóstico. Para un mecánico, no se pueden configurar dos motores por igual. Por lo tanto, los sistemas entrenados en el espacio virtual pueden experimentar dificultades al comenzar en condiciones reales.La segunda trampa, de la que DeepMind rara vez habla, es que el éxito en entornos virtuales depende de tener una función de recompensa: una señal que permita a una red neuronal medir su progreso. El programa ve que el rebote repetido desde la pared posterior aumenta la puntuación. Una parte clave del desarrollo de AlphaGo fue la creación de una función de recompensa compatible con un juego tan complejo. Desafortunadamente, el mundo real no ofrece recompensas simples. El progreso rara vez se mide por puntos individuales. Incluso si existen, la tarea se complica por problemas políticos. Establecer la señal de recompensa para mejorar el clima (concentración de CO₂ en la atmósfera) contradice la señal de recompensa para las compañías petroleras (precio de las acciones) y requiere un compromiso con muchas personas con motivaciones conflictivas. Las señales de recompensa suelen ser muy débiles.El cerebro humano rara vez recibe comentarios claros sobre el éxito de una tarea durante su ejecución.
DeepMind ha encontrado una forma efectiva de aprender utilizando una gran cantidad de recursos informáticos. El programa AlphaGo estudió durante miles de años de juego antes de entender algo. Muchos expertos en IA sospechan que este método no funcionará para tareas que ofrecen recompensas más débiles. DeepMind reconoce el problema. Recientemente se enfocó en StarCraft 2, un juego de computadora estratégico. Las decisiones tomadas al comienzo del juego tienen consecuencias mucho más tardías, lo que está más cerca de los comentarios confusos y tardíos en el mundo real. En enero, DeepMind derrotó a algunos de los mejores jugadores del mundo en la demostración, que, aunque era muy limitada, todavía era impresionante. Sus programas también comenzaron a estudiar las funciones de recompensa, teniendo en cuenta los comentarios de un maestro humano. Pero al emplear a un maestro, corre el riesgo de perder las economías de escala y velocidad que ofrece el procesamiento informático puro.
Los investigadores actuales y anteriores de DeepMind y Google, que pidieron permanecer en el anonimato debido a estrictos acuerdos de confidencialidad, también han expresado su escepticismo de que al usar dichos métodos, DeepMind puede crear una IA fuerte. Según ellos, el énfasis en el alto rendimiento en entornos virtuales hace que sea difícil resolver el problema con la señal de recompensa. Aún así, un enfoque de juego es el núcleo de DeepMind. La compañía tiene una tabla de clasificación interna donde los programas de equipos de programación competidores compiten por dominios virtuales.
Hassabis siempre ha percibido la vida como un juego. La mayor parte de su carrera está dedicada al desarrollo de juegos, y la mayor parte de su tiempo libre lo dedica a la práctica de juegos. En DeepMind, eligió los juegos como su principal medio para construir una IA fuerte. Al igual que su software, Hassabis solo puede aprender de su propia experiencia. La gente puede olvidarse de la tarea inicial, ya que DeepMind ya ha inventado algunas tecnologías médicas útiles y ha superado a los mejores jugadores en la clase de juegos de mesa. Estos son logros importantes, pero no aquellos que el fundador de la compañía anhela. Sin embargo, todavía tiene la oportunidad de crear una IA fuerte justo debajo de las narices de Google, pero fuera del control de la corporación. Si esto tiene éxito, entonces Demis Hassabis ganará el juego más difícil.