DeepMind y Google: la batalla por el control sobre una IA fuerte


Demis Hassabis fund√≥ la compa√Ī√≠a para crear la IA m√°s poderosa del mundo. Luego fue comprado por Google

En agosto de 2010, un londinense de 34 a√Īos llamado Demis Hassabis subi√≥ al escenario en una sala de conferencias en un suburbio de San Francisco. Sali√≥ con un paso tranquilo de un hombre que estaba tratando de controlar sus nervios, frunci√≥ los labios con una breve sonrisa y comenz√≥: "Entonces, hoy hablaremos sobre diferentes enfoques para el desarrollo ...", dud√≥, como si de repente se diera cuenta de que estaba expresando pensamientos ambiciosos secretos. Pero luego dijo: "... una IA fuerte".

La IA fuerte (inteligencia general artificial o AGI) significa inteligencia artificial universal: un programa inform√°tico hipot√©tico capaz de realizar tareas intelectuales como persona o incluso mejor. Una IA fuerte podr√° realizar tareas individuales, como reconocimiento de fotos o traducci√≥n de texto, que son las √ļnicas tareas de cada una de las IA d√©biles en nuestros tel√©fonos y computadoras. Pero tambi√©n jugar√° ajedrez y hablar√° franc√©s. Entender√° art√≠culos sobre f√≠sica, compondr√° novelas, desarrollar√° estrategias de inversi√≥n y mantendr√° conversaciones encantadoras con extra√Īos. Supervisar√° las reacciones nucleares, gestionar√° las redes el√©ctricas y los flujos de tr√°fico y, sin mucho esfuerzo, tendr√° √©xito en todo lo dem√°s. AGI har√° que la IA m√°s avanzada de hoy parezca una calculadora de bolsillo.

La √ļnica inteligencia que actualmente es capaz de realizar todas estas tareas es aquella con la que las personas est√°n dotadas. Pero la inteligencia humana est√° limitada por el tama√Īo del cr√°neo. La fuerza de nuestro cerebro est√° limitada por la cantidad insignificante de energ√≠a que el cuerpo puede proporcionar. Debido a que AGI se ejecuta en computadoras, no sufrir√° ninguna de estas limitaciones. La inteligencia fuerte est√° limitada solo por la cantidad de procesadores disponibles. Puede comenzar por monitorear las reacciones nucleares. Pero abrir√° r√°pidamente nuevas fuentes de energ√≠a, digiriendo m√°s trabajo cient√≠fico en f√≠sica por segundo de lo que una persona puede hacer en mil vidas. La inteligencia humana, combinada con la velocidad y escalabilidad de las computadoras, har√° desaparecer los problemas que actualmente parecen insolubles. En una entrevista con British Observer, Hassabis dijo que, entre otras cosas, una IA fuerte necesita dominar tales disciplinas y resolver problemas tales como "c√°ncer, cambio clim√°tico, energ√≠a, gen√≥mica, macroeconom√≠a [y] sistemas financieros".

La conferencia de Hassabis se llam√≥ Singularity Summit. Seg√ļn los futur√≥logos, la singularidad es una de las consecuencias m√°s probables de la aparici√≥n de AGI. Como procesa la informaci√≥n a alta velocidad, se vuelve m√°s sabia muy r√°pidamente. Los ciclos r√°pidos de superaci√≥n personal conducir√°n a una explosi√≥n de inteligencia de m√°quina, dejando a las personas muy atrasadas con el polvo de silicio. Dado que este futuro est√° completamente construido sobre la base de suposiciones no verificadas, la cuesti√≥n de si la singularidad se considera utop√≠a o infierno es casi religiosa.

A juzgar por los nombres de las conferencias en la conferencia, los participantes gravitan hacia el mesianismo: "Razón y cómo construirlo"; "La IA como solución al problema del envejecimiento"; "Reemplazo de nuestros cuerpos"; "Cambiar el límite entre la vida y la muerte". La conferencia de Hassabis, por otro lado, no parece muy impresionante: "Un enfoque neurobiológico sistémico para construir un AGI".

Hassabis camina entre el podio y la pantalla, diciendo algo r√°pidamente. Lleva un c√°rdigan marr√≥n y una camisa blanca con botones, como un ni√Īo de escuela. Parece que un peque√Īo crecimiento solo fortalece su inteligencia. Hasta ahora, explic√≥ Hassabis, los cient√≠ficos se han acercado a AGI desde dos lados. En el campo de la IA simb√≥lica, los investigadores trataron de describir y programar todas las reglas para un sistema que podr√≠a pensar como una persona. Este enfoque fue popular en los a√Īos 80-90, pero no dio los resultados deseados. Hassabis cree que la estructura mental del cerebro es demasiado sofisticada para ser descrita de esta manera.

Los investigadores que intentaron reproducir las redes f√≠sicas del cerebro en forma digital trabajaron en otra √°rea. Esto ten√≠a un significado definido. Despu√©s de todo, el cerebro es el recept√°culo de la inteligencia humana. Pero estos investigadores fueron enga√Īados, dijo Hassabis. Su tarea result√≥ ser aproximadamente de la misma escala que un intento de mapear todas las estrellas en el universo. Adem√°s, se centra en el nivel equivocado. Es como tratar de entender c√≥mo funciona Microsoft Excel desmontando una computadora y estudiando las interacciones de transistores.

En cambio, Hassabis propuso un t√©rmino medio: una IA fuerte deber√≠a inspirarse en los amplios m√©todos por los cuales el cerebro procesa la informaci√≥n, y no en los sistemas f√≠sicos o las reglas espec√≠ficas que aplica en situaciones espec√≠ficas. En otras palabras, los cient√≠ficos deber√≠an centrarse en comprender el software del cerebro, no su hardware. Los nuevos m√©todos, como la resonancia magn√©tica funcional, le permiten mirar dentro del cerebro durante su actividad. Hacen posible tal comprensi√≥n. Estudios recientes han demostrado que el cerebro aprende en un sue√Īo, reproduciendo las experiencias recibidas para derivar principios generales. Los investigadores de IA deben emular este sistema.

En la esquina inferior derecha de la diapositiva apareci√≥ un logotipo: un remolino azul redondo. Debajo hay dos palabras: DeepMind. Esta fue la primera menci√≥n p√ļblica de una nueva empresa.



Hassabis pas√≥ un a√Īo entero tratando de obtener una invitaci√≥n a Singularity Summit. La conferencia fue solo una tapadera. Lo que realmente necesitaba era un minuto con Peter Thiel, el multimillonario de Silicon Valley que patrocin√≥ la conferencia. Hassabis quer√≠a su inversi√≥n.

Hassabis nunca dijo por qu√© busc√≥ obtener el apoyo de Thiel precisamente (para este art√≠culo, rechaz√≥ varias solicitudes de entrevistas a trav√©s de un portavoz). Hablamos con 25 fuentes, incluidos empleados e inversores actuales y anteriores. La mayor√≠a de ellos hablaron an√≥nimamente porque no ten√≠an derecho a hablar sobre la compa√Ī√≠a. Pero Thiel cree en AGI con mayor fervor que Hassabis. En un discurso en 2009, Thiel dijo que su mayor temor por el futuro no es un levantamiento rob√≥tico (aunque en Nueva Zelanda, aislado del mundo entero, est√° mejor protegido que la mayor√≠a de las personas). M√°s bien, teme que la singularidad llegue demasiado tarde. El mundo necesita nuevas tecnolog√≠as para evitar una recesi√≥n econ√≥mica.

Finalmente, DeepMind recibi√≥ ¬£ 2 millones en fondos de capital de riesgo; incluyendo ¬£ 1.4 millones de Thiel. Cuando Google compr√≥ la compa√Ī√≠a en enero de 2014 por $ 600 millones, los primeros inversores registraron una ganancia del 5,000%.

Para muchos fundadores, este ser√≠a un final feliz. Puede reducir la velocidad, dar un paso atr√°s y disfrutar del dinero. Para Hassabis, el acuerdo con Google fue otro paso en su b√ļsqueda de una IA fuerte. Pas√≥ casi todo el 2013 en negociaciones sobre el acuerdo. DeepMind actuar√° por separado de la empresa matriz. Hassabis recibir√° todos los privilegios corporativos, como el acceso al flujo de efectivo y el poder de procesamiento, sin perder el control de la empresa.

Hassabis pensó que DeepMind sería un híbrido: tendría una unidad de arranque, el cerebro de las mejores universidades y los bolsillos profundos de una de las empresas más ricas del mundo. Todo se hizo para acelerar el desarrollo de una IA fuerte y ayudar a la humanidad.



Demis Hassabis naci√≥ en el norte de Londres en 1976 en la familia de un grecochipriota y un chino-singapurense. Era el mayor de tres hermanos y hermanas. Mam√° trabajaba en los grandes almacenes John Lewis y su padre trabajaba en una jugueter√≠a. El ni√Īo aprendi√≥ a jugar ajedrez a la edad de cuatro a√Īos, viendo el juego de su padre y su t√≠o. Despu√©s de algunas semanas, los adultos ya no pod√≠an vencerlo. A la edad de 13 a√Īos, Demis se convirti√≥ en el segundo jugador de ajedrez del mundo a su edad. A los ocho a√Īos, aprendi√≥ independientemente a programar.

En 1992, Hassabis se gradu√≥ de la escuela dos a√Īos antes de lo previsto. Obtuvo un trabajo programando videojuegos en Bullfrog Productions, donde escribi√≥ el juego Theme Park. En √©l, los jugadores construyeron y administraron un parque de atracciones virtual. El juego tuvo mucho √©xito con 15 millones de copias vendidas. Pertenec√≠a a un nuevo g√©nero de simuladores, en el que el objetivo no es derrotar al enemigo, sino optimizar el funcionamiento de un sistema tan complejo como un negocio o una ciudad.


Parque tem√°tico para Android, 2018

Demis no solo desarrolló juegos, sino que también jugó grandes juegos. Cuando era adolescente, se debatía entre competencias en ajedrez, scrabble, póker y backgammon. En 1995, mientras estudiaba informática en la Universidad de Cambridge, Hassabis se metió en un torneo de estudiantes. Este es un antiguo juego de estrategia de mesa, que es mucho más complicado que el ajedrez. Se supone que el dominio requiere intuición adquirida a través de una larga experiencia. Nadie sabía si Hassabis había jugado antes.

Primero, Hassabis gan√≥ el torneo para principiantes. Luego venci√≥ al ganador del torneo para jugadores experimentados, aunque con una desventaja. Organizador del torneo, el maestro de Cambridge Charles Matthews recuerda la conmoci√≥n de un jugador experimentado despu√©s de perder ante un novato de 19 a√Īos. Matthews tom√≥ a Hassabis bajo su cuidado.

La inteligencia y las ambiciones de Hassabis siempre han sido evidentes en los juegos. Los juegos, a su vez, despertaron su inter√©s en la inteligencia. Al observar su progreso en el ajedrez, se pregunt√≥: ¬Ņes posible programar computadoras para que aprendan como √©l, bas√°ndose en la experiencia? Los juegos ofrec√≠an un entorno de aprendizaje que el mundo real no pod√≠a igualar. Eran claros y autosuficientes. Dado que los juegos est√°n separados de la realidad, se pueden practicar sin interferir con el mundo real y dominarlos de manera efectiva. Los juegos aceleran el tiempo: en un par de d√≠as puedes crear un sindicato criminal, y la batalla en el Somme termina en cuesti√≥n de minutos.

En el verano de 1997, Hassabis viaj√≥ a Jap√≥n. En mayo de ese a√Īo, la computadora Deep Blue de IBM derrot√≥ al campe√≥n mundial de ajedrez Garry Kasparov. Por primera vez, una computadora venci√≥ a un gran maestro de ajedrez. El partido atrajo la atenci√≥n mundial y gener√≥ preocupaciones sobre el creciente poder y la amenaza potencial de las computadoras. Cuando Hassabis se reuni√≥ con el maestro japon√©s de juegos de mesa Masahiko Fuzuvarea, le cont√≥ sobre un plan que combina sus intereses en juegos estrat√©gicos e inteligencia artificial: un d√≠a construir√° un programa de computadora que derrotar√° al mejor jugador en marcha.

Hassabis actu√≥ met√≥dicamente: "A la edad de 20 a√Īos, Hassabis era de la opini√≥n de que ciertas cosas deben estar en su lugar antes de involucrarse en la IA al nivel que quer√≠a", dice Matthews. "Ten√≠a un plan".

En 1998, fund√≥ su propio estudio de juegos Elixir. Hassabis se centr√≥ en un juego extremadamente ambicioso: Republic: The Revolution, un complejo simulador pol√≠tico. Hace muchos a√Īos, en la escuela, Hassabis le dijo a su amigo Mustafa Suleiman que el mundo necesitaba un simulador grandioso para simular su din√°mica compleja y resolver los problemas sociales m√°s complejos. Ahora trat√≥ de hacerlo en el juego.

Encajar en el marco del juego fue m√°s dif√≠cil de lo que esperaba. Al final, Elixir lanz√≥ una versi√≥n abreviada del juego para suavizar las rese√Īas. Otros juegos han fallado (incluido un simulador de villano Bondian llamado Evil Genius). En abril de 2005, Hassabis cerr√≥ Elixir. Matthews cree que Hassabis fund√≥ la compa√Ī√≠a simplemente para obtener experiencia gerencial. Ahora, Demis solo necesitaba un √°rea importante de conocimiento para comenzar a trabajar en una IA fuerte. Necesitaba entender el cerebro humano.

En 2005, Hassabis obtuvo un doctorado en neurociencia en el University College London (UCL). Public√≥ estudios famosos de memoria e imaginaci√≥n. Uno de sus art√≠culos, que desde entonces ha sido citado m√°s de 1,000 veces, mostr√≥ que las personas con amnesia tambi√©n tienen dificultades para comprender nuevas experiencias, lo que sugiere que existe una conexi√≥n entre recordar y crear im√°genes mentales. Hassabis cre√≥ una representaci√≥n cerebral adecuada para la tarea de crear AGI. La mayor parte del trabajo se redujo a una pregunta: ¬Ņc√≥mo recibe y preserva el cerebro humano los conceptos y el conocimiento?

Hassabis fund√≥ oficialmente DeepMind el 15 de noviembre de 2010. Desde entonces, la misi√≥n de la compa√Ī√≠a no ha cambiado: "resolver la inteligencia" y luego usarla para resolver todo lo dem√°s. Como Hassabis dijo a los participantes de la Cumbre de Singularity, esto significa traducir nuestra comprensi√≥n de c√≥mo funciona el cerebro en software que puede usar los mismos m√©todos de autoaprendizaje.

Hassabis comprende que la ciencia a√ļn no ha captado completamente la esencia de la mente humana. Un proyecto de IA fuerte no puede simplemente crearse sobre la base de cientos de estudios neurobiol√≥gicos. Pero √©l cree claramente que ya se sabe lo suficiente como para comenzar a trabajar en una IA fuerte. Y, sin embargo, existe la posibilidad de que su confianza est√© por delante de la realidad. Todav√≠a sabemos muy poco c√≥mo funciona realmente el cerebro. En 2018, un equipo de investigadores australianos cuestion√≥ los resultados de la propia tesis doctoral de Hassabis. Este es solo un art√≠culo, pero muestra que las opiniones cient√≠ficas que subyacen a DeepMind est√°n lejos de ser consensuadas.

La compa√Ī√≠a fue cofundada por Mustafa Suleiman y Shane Legge, un neozeland√©s obsesivo de AGI a quien Hassabis tambi√©n conoci√≥ en UCL. La reputaci√≥n de la compa√Ī√≠a estaba creciendo y Hassabis estaba cosechando los beneficios de su talento. "Es como un im√°n", dice Ben Faulkner, ex gerente de operaciones de DeepMind. Muchos empleados viv√≠an en Europa, lejos de los departamentos de recursos humanos de los gigantes de Silicon Valley como Google y Facebook. Quiz√°s el principal logro de DeepMind fue la contrataci√≥n de empleados justo despu√©s de su fundaci√≥n para encontrar y retener los mejores y m√°s brillantes talentos en el campo de la IA. La compa√Ī√≠a abri√≥ una oficina en el √°tico de una casa en Russell Square en Bloomsbury, al otro lado de la calle de UCL.

Uno de los m√©todos de aprendizaje autom√°tico en el que la compa√Ī√≠a se ha centrado ha surgido de la doble pasi√≥n de Hassabis por los juegos y la neurociencia: el aprendizaje reforzado. Tal programa est√° dise√Īado para recopilar informaci√≥n sobre el medio ambiente y luego estudiarlo, reproduciendo repetidamente la experiencia adquirida, como la actividad del cerebro humano en un sue√Īo, como dijo Hassabis en su conferencia sobre Singularity Summit.

El entrenamiento de refuerzo comienza desde cero. El programa muestra un entorno virtual sobre el cual no conoce nada más que las reglas. Por ejemplo, una simulación de un juego de ajedrez o videojuegos. Un programa contiene al menos un componente conocido como red neuronal. Consiste en capas de estructuras computacionales que tamizan la información para identificar funciones o estrategias específicas. Cada capa explora el entorno en un nuevo nivel de abstracción. Al principio, estas redes operan con un éxito mínimo, pero es importante que cada falla deje una marca y se codifique dentro de la red. Poco a poco, la red neuronal se está volviendo más sofisticada, ya que está experimentando con diferentes estrategias, y recibe una recompensa si tiene éxito. Si el programa mueve la pieza de ajedrez y, como resultado, pierde el juego, no repetirá este error. La mayor parte de la magia de la inteligencia artificial es la velocidad a la que repite sus tareas.

La culminaci√≥n del trabajo de DeepMind fue 2016, cuando la compa√Ī√≠a lanz√≥ el programa AlphaGo, que utilizaba entrenamiento de refuerzo junto con otros m√©todos para jugar. Para sorpresa de todos, en un duelo de cinco partidos en Se√ļl, el programa venci√≥ al campe√≥n mundial. 280 millones de espectadores vieron la victoria del autom√≥vil: este evento ocurri√≥ una d√©cada antes de lo que predijeron los expertos. Al a√Īo siguiente, una versi√≥n mejorada de AlphaGo derrot√≥ al campe√≥n chino de go.

Al igual que Deep Blue en 1997, AlphaGo ha cambiado la percepci√≥n de lo que constituye la excelencia humana. Los campeones de juegos de mesa, algunas de las mentes m√°s brillantes del planeta, ya no se consideraban el pin√°culo de la inteligencia. Casi 20 a√Īos despu√©s de una conversaci√≥n con el maestro japon√©s Fujuwaraa, Hassabis cumpli√≥ su promesa. M√°s tarde dijo que casi se ech√≥ a llorar durante el partido. Seg√ļn la tradici√≥n, el estudiante que va le agradece al maestro al derrotarlo en el partido. Hassabis agradeci√≥ a Matthews, derrotando todo el juego.

DeepBlue gan√≥ gracias a la fuerza bruta y la velocidad computacional, pero el estilo de AlphaGo parec√≠a art√≠stico, casi humano. Su gracia y sofisticaci√≥n, la superioridad de los m√ļsculos computacionales parec√≠an mostrar que DeepMind avanz√≥ m√°s que sus competidores en el desarrollo de un programa que pod√≠a tratar enfermedades y administrar ciudades.



Hassabis siempre ha dicho que DeepMind cambiar√° el mundo para mejor. Pero no hay certeza sobre una IA fuerte. Si alguna vez surge, no sabemos si ser√° altruista o malicioso, si se someter√° al control humano. Aun as√≠, ¬Ņqui√©n tomar√° el control?

Desde el principio, Hassabis intent√≥ defender la independencia de DeepMind. Siempre insisti√≥ en que DeepMind se quedara en Londres. Cuando Google compr√≥ la compa√Ī√≠a en 2014, el tema del control se hizo m√°s relevante. Hassabis no estaba obligado a vender la empresa. Ten√≠a suficiente dinero y describi√≥ un modelo de negocio mediante el cual la compa√Ī√≠a desarrolla juegos para financiar la investigaci√≥n. Las finanzas de Google ten√≠an peso, pero, como muchos fundadores, Hassabis no quer√≠a renunciar a la compa√Ī√≠a que hab√≠a crecido. Como parte del acuerdo, DeepMind celebr√≥ un acuerdo que evitar√≠a que Google tome el control unilateral de la propiedad intelectual de la compa√Ī√≠a.Seg√ļn una persona informada, antes de la transacci√≥n, las partes firmaron un contrato denominado Acuerdo de revisi√≥n de √©tica y seguridad. El acuerdo, que no se inform√≥ anteriormente, fue elaborado por abogados serios de Londres.

El acuerdo transfiere el control de la tecnolog√≠a central de una IA fuerte a DeepMind cada vez que se crea esa IA, es decir, un grupo directivo llamado Junta de √Čtica. Seg√ļn la misma fuente, el Consejo de √Čtica no es una concesi√≥n cosm√©tica de Google. Brinda a DeepMind un s√≥lido respaldo legal para mantener el control de su tecnolog√≠a m√°s valiosa y potencialmente m√°s peligrosa. Los nombres de los miembros del consejo no se hicieron p√ļblicos, pero otra fuente cercana a DeepMind y Google dice que incluye a los tres fundadores de DeepMind (la compa√Ī√≠a se neg√≥ a responder preguntas sobre el acuerdo, pero dijo que ‚Äúel control √©tico desde los primeros d√≠as fue para nosotros prioridad ").

Hassabis puede determinar el destino de DeepMind de otras maneras. Uno de ellos es la lealtad del personal. Los empleados anteriores y actuales dicen que el programa de investigaci√≥n de Hassabis es una de las mayores fortalezas de DeepMind. Su programa ofrece un trabajo fascinante e importante, libre de la presi√≥n de los c√≠rculos acad√©micos. Tales condiciones atrajeron a cientos de los expertos m√°s talentosos del mundo. DeepMind tiene filiales en Par√≠s y Alberta. Muchos empleados se sienten m√°s cercanos a Hassabis y su misi√≥n que a la corporaci√≥n matriz que ans√≠a ingresos. Mientras Hassabis mantenga su lealtad personal, tendr√° un poder significativo sobre su √ļnico accionista. Para Google, es mejor que los talentos de DeepMind trabajen para ella a trav√©s de un intermediario que se van a Facebook o Apple.

DeepMind tiene una palanca m√°s, aunque requiere una reposici√≥n constante: publicidad favorable. La compa√Ī√≠a est√° bien. AlphaGo se ha convertido en una verdadera bomba de relaciones p√ļblicas. Desde la adquisici√≥n de Google, la compa√Ī√≠a ha producido repetidamente milagros que han atra√≠do la atenci√≥n mundial. Un programa de DeepMind puede diagnosticar enfermedades oculares al escanear la retina. Otro aprendi√≥ a jugar ajedrez desde cero utilizando la arquitectura de estilo AlphaGo, convirti√©ndose en el mejor jugador de ajedrez de todos los tiempos en solo nueve horas de autoaprendizaje. En diciembre de 2018, un programa llamado AlphaFold super√≥ a sus competidores en la tarea de predecir la estructura tridimensional de las prote√≠nas utilizando una lista de componentes, lo que podr√≠a allanar el camino para el tratamiento de enfermedades como la enfermedad de Parkinson y el Alzheimer.

DeepMind est√° particularmente orgulloso de los algoritmos desarrollados que calculan los medios de enfriamiento m√°s efectivos de los centros de datos de Google, donde se ejecutan aproximadamente 2.5 millones de servidores. DeepMind dijo en 2016 que redujeron los costos de energ√≠a de Google en un 40%. Pero algunos expertos dicen que esta es una figura exagerada. Google utiliz√≥ algoritmos para optimizar los centros de datos mucho antes de DeepMind: "Solo quieren que algunas relaciones p√ļblicas agreguen valor a Alphabet", dice un empleado de Google. La empresa matriz de Alphabet, Google, paga generosamente a DeepMind por dichos servicios. Entonces, en 2017, DeepMind le factur√≥ ¬£ 54 millones. Esta cifra palidece en comparaci√≥n con los gastos actuales de DeepMind: solo se gastaron $ 200 millones en personal ese a√Īo. En general, las p√©rdidas de DeepMind en 2017 ascendieron a ¬£ 282 millones.

Estos son centavos miserables para el rico gigante de Internet. Pero otras compa√Ī√≠as no rentables Alphabet atrajeron la atenci√≥n de Ruth Porat, la directora financiera frugal de Alphabet. Por ejemplo, la divisi√≥n Google Fiber trat√≥ de crear un proveedor de servicios de Internet de alta velocidad ejecutando l√≠neas de fibra √≥ptica en hogares privados. Pero el proyecto se suspendi√≥ cuando qued√≥ claro que tomar√≠a d√©cadas devolver la inversi√≥n. Por lo tanto, es importante que los investigadores de IA demuestren su relevancia para no atraer la mirada tenaz de la Sra. Porat, cuyo nombre ya se ha convertido en un nombre familiar en Alphabet.

Los logros planificados de DeepMind en IA son parte de una estrategia de relaci√≥n con los propietarios de la compa√Ī√≠a. DeepMind se√Īala su reputaci√≥n. Esto es especialmente importante cuando Google es acusado de invadir la privacidad del usuario y difundir noticias falsas. DeepMind tambi√©n tuvo la suerte de tener un seguidor al m√°s alto nivel: Larry Page, uno de los dos fundadores de Google, ahora CEO de Alphabet. Page es lo m√°s cercano que Hassabis tiene a su empresa matriz. El padre de Page, Carl, estudi√≥ redes neuronales en los a√Īos 60. Al comienzo de su carrera, Page dijo que cre√≥ Google √ļnicamente para fundar la compa√Ī√≠a de inteligencia artificial.

El control estricto sobre DeepMind, para verse bien a los ojos de la prensa, no coincide con el esp√≠ritu acad√©mico que impregna la empresa. Algunos investigadores se quejan de que les es dif√≠cil publicar su trabajo: tienen que superar varios niveles de censura interna antes de que al menos puedan presentar un informe para la conferencia o un art√≠culo para la revista. DeepMind cree que debes tener cuidado de no asustar al p√ļblico ante la perspectiva de una IA fuerte. Pero un silencio demasiado denso puede arruinar la atm√≥sfera acad√©mica y debilitar la lealtad de los empleados.

Cinco a√Īos despu√©s de la adquisici√≥n de Google, la cuesti√≥n de qui√©n controla DeepMind se est√° acercando a un punto cr√≠tico. Los fundadores y primeros empleados de la compa√Ī√≠a pronto podr√°n irse con su compensaci√≥n financiera (las acciones de Hassabis, probablemente despu√©s de la compra de Google valen alrededor de ¬£ 100 millones). Pero una fuente cercana a la compa√Ī√≠a sugiere que Alphabet ha pospuesto la monetizaci√≥n de las opciones de los fundadores por dos a√Īos. Dado su enfoque implacable en la misi√≥n, es poco probable que Hassabis abandone el barco. El dinero solo le interesa en la medida en que ayuda a alcanzar el objetivo de toda su vida. Pero algunos colegas ya se han ido. Desde principios de 2019, tres ingenieros de IA han abandonado la empresa. Y Ben Laurie, uno de los profesionales de seguridad m√°s famosos del mundo, ahora ha regresado a Google, a su empleador anterior. Este n√ļmero es peque√ĪoDespu√©s de todo, DeepMind ofrece una misi√≥n tan emocionante y un salario decente que pocos se van.

Hasta ahora, Google no ha intervenido en DeepMind. Pero un evento reciente suscit√≥ preocupaci√≥n sobre cu√°nto tiempo la compa√Ī√≠a podr√° mantener la independencia.


DeepMind siempre ha planeado usar IA para mejorar la atención médica. En febrero de 2016, se creó una nueva división de DeepMind Health, dirigida por Mustafa Suleiman, uno de los cofundadores. Suleiman, cuya madre trabajaba como enfermera en el Servicio Nacional de Salud (NHS), esperaba crear un programa llamado Streams que alertaría a los médicos cuando la salud de un paciente empeora. DeepMind tuvo que ganar en cada operación efectiva del sistema. Dado que este trabajo requería acceso a información confidencial del paciente, Suleiman estableció el Panel de Revisión Independiente (IRP), que incluía representantes de los sectores de tecnología y atención médica británicos. DeepMind actuó con mucho cuidado. Posteriormente, el Comisionado de Información británico descubrióque uno de los hospitales asociados violó la ley al procesar datos de pacientes. Sin embargo, a fines de 2017, Suleiman había firmado acuerdos con cuatro hospitales principales del NHS.

El 8 de noviembre de 2018, Google anunci√≥ la creaci√≥n de su propia divisi√≥n de Google Health. Cinco d√≠as despu√©s, anunciaron que DeepMind Health deber√≠a incluirse en la unidad para padres. Aparentemente, DeepMind no advirti√≥ a nadie. De acuerdo con los documentos que recibimos a pedido de conformidad con la Ley de Libertad de Informaci√≥n, DeepMind notific√≥ a los hospitales asociados de este cambio en solo tres d√≠as. La compa√Ī√≠a declin√≥ informar cuando comenzaron las discusiones sobre la fusi√≥n, pero dijo que la brecha entre el aviso y el anuncio p√ļblico era de inter√©s para la transparencia. Suleiman escribi√≥ en 2016 que "en ning√ļn momento los datos del paciente se asociar√°n con cuentas, productos o servicios de Google". Parece que su promesa se rompi√≥. (Respondiendo preguntas de nuestra publicaci√≥n, dijo DeepMindque "en esta etapa, ninguno de nuestros contratos fue a Google, y esto es posible solo con el consentimiento de nuestros socios. El hecho de que Streams se haya convertido en un servicio de Google no significa que los datos del paciente ... puedan usarse en otros productos o servicios de Google ".

La anexi√≥n de Google enfureci√≥ a los empleados de DeepMind Health. Seg√ļn las personas cercanas a esta unidad, al finalizar la adquisici√≥n, muchos empleados planean renunciar. Uno de los miembros del IRP, Mike Bracken, ya se fue. Seg√ļn varias personas familiarizadas con el evento, Bracken se fue en diciembre de 2017 debido al temor de que la "comisi√≥n de control" sea m√°s un escaparate que una verdadera supervisi√≥n. Cuando Bracken le pregunt√≥ a Suleiman si ser√≠a responsable ante la comisi√≥n y equiparar√≠a sus poderes con los directores no ejecutivos, Suleiman solo sonri√≥. (Un portavoz de DeepMind dijo que "no recuerda" sobre tal incidente). Julian Huppert, jefe del IRP, afirma que el grupo proporcion√≥ "una gobernanza m√°s radical" de lo que Brecken esperaba, ya que los miembros pod√≠an hablar abiertamente y no estaban obligados por un deber de confidencialidad.

Este episodio revela que las unidades periféricas de DeepMind son vulnerables a Google. La declaración de DeepMind decía: "Todos estuvimos de acuerdo en que tiene sentido combinar estos esfuerzos en un solo proyecto conjunto con un recurso más poderoso". La pregunta es si Google aplicaría la misma lógica al trabajo de DeepMind en una IA fuerte.

Desde el exterior, parece que DeepMind ha logrado un gran √©xito. Ella ya ha desarrollado un software capaz de aprender a completar tareas en un nivel sobrehumano. Hassabis a menudo menciona Breakout, un videojuego para la consola Atari. El jugador Breakout controla la plataforma en la parte inferior de la pantalla y refleja la pelota que rebota en los bloques en la parte superior, colapsando por el golpe. El jugador gana cuando se destruyen todos los bloques. Pierde si pierde la pelota. Sin instrucciones humanas, el programa DeepMind no solo aprendi√≥ a jugar el juego, sino que tambi√©n desarroll√≥ una estrategia para lanzar la pelota al espacio sobre los bloques, donde salta durante mucho tiempo y gana muchos puntos sin esfuerzo por parte del jugador. Seg√ļn Hassabis, esto demuestra el poder del aprendizaje reforzado y las habilidades paranormales de los programas de computadora DeepMind.

Una demostraci√≥n impresionante. Pero a Hassabis le falta algo. Si mueve la plataforma virtual al menos un par de p√≠xeles hacia arriba, el programa fallar√°. La habilidad adquirida por DeepMind es tan limitada que ni siquiera puede responder a peque√Īos cambios ambientales que las personas pueden tener en cuenta, al menos no sin miles de rondas de entrenamiento adicionales. Pero tales cambios son una parte integral de la realidad circundante. No hay dos √≥rganos id√©nticos del cuerpo para el diagn√≥stico. Para un mec√°nico, no se pueden configurar dos motores por igual. Por lo tanto, los sistemas entrenados en el espacio virtual pueden experimentar dificultades al comenzar en condiciones reales.

La segunda trampa, de la que DeepMind rara vez habla, es que el √©xito en entornos virtuales depende de tener una funci√≥n de recompensa: una se√Īal que permita a una red neuronal medir su progreso. El programa ve que el rebote repetido desde la pared posterior aumenta la puntuaci√≥n. Una parte clave del desarrollo de AlphaGo fue la creaci√≥n de una funci√≥n de recompensa compatible con un juego tan complejo. Desafortunadamente, el mundo real no ofrece recompensas simples. El progreso rara vez se mide por puntos individuales. Incluso si existen, la tarea se complica por problemas pol√≠ticos. Establecer la se√Īal de recompensa para mejorar el clima (concentraci√≥n de CO‚āā en la atm√≥sfera) contradice la se√Īal de recompensa para las compa√Ī√≠as petroleras (precio de las acciones) y requiere un compromiso con muchas personas con motivaciones conflictivas. Las se√Īales de recompensa suelen ser muy d√©biles.El cerebro humano rara vez recibe comentarios claros sobre el √©xito de una tarea durante su ejecuci√≥n.



DeepMind ha encontrado una forma efectiva de aprender utilizando una gran cantidad de recursos inform√°ticos. El programa AlphaGo estudi√≥ durante miles de a√Īos de juego antes de entender algo. Muchos expertos en IA sospechan que este m√©todo no funcionar√° para tareas que ofrecen recompensas m√°s d√©biles. DeepMind reconoce el problema. Recientemente se enfoc√≥ en StarCraft 2, un juego de computadora estrat√©gico. Las decisiones tomadas al comienzo del juego tienen consecuencias mucho m√°s tard√≠as, lo que est√° m√°s cerca de los comentarios confusos y tard√≠os en el mundo real. En enero, DeepMind derrot√≥ a algunos de los mejores jugadores del mundo en la demostraci√≥n, que, aunque era muy limitada, todav√≠a era impresionante. Sus programas tambi√©n comenzaron a estudiar las funciones de recompensa, teniendo en cuenta los comentarios de un maestro humano. Pero al emplear a un maestro, corre el riesgo de perder las econom√≠as de escala y velocidad que ofrece el procesamiento inform√°tico puro.

Los investigadores actuales y anteriores de DeepMind y Google, que pidieron permanecer en el anonimato debido a estrictos acuerdos de confidencialidad, tambi√©n han expresado su escepticismo de que al usar dichos m√©todos, DeepMind puede crear una IA fuerte. Seg√ļn ellos, el √©nfasis en el alto rendimiento en entornos virtuales hace que sea dif√≠cil resolver el problema con la se√Īal de recompensa. A√ļn as√≠, un enfoque de juego es el n√ļcleo de DeepMind. La compa√Ī√≠a tiene una tabla de clasificaci√≥n interna donde los programas de equipos de programaci√≥n competidores compiten por dominios virtuales.

Hassabis siempre ha percibido la vida como un juego. La mayor parte de su carrera est√° dedicada al desarrollo de juegos, y la mayor parte de su tiempo libre lo dedica a la pr√°ctica de juegos. En DeepMind, eligi√≥ los juegos como su principal medio para construir una IA fuerte. Al igual que su software, Hassabis solo puede aprender de su propia experiencia. La gente puede olvidarse de la tarea inicial, ya que DeepMind ya ha inventado algunas tecnolog√≠as m√©dicas √ļtiles y ha superado a los mejores jugadores en la clase de juegos de mesa. Estos son logros importantes, pero no aquellos que el fundador de la compa√Ī√≠a anhela. Sin embargo, todav√≠a tiene la oportunidad de crear una IA fuerte justo debajo de las narices de Google, pero fuera del control de la corporaci√≥n. Si esto tiene √©xito, entonces Demis Hassabis ganar√° el juego m√°s dif√≠cil.

Source: https://habr.com/ru/post/444234/


All Articles