Redes neuronales y aprendizaje profundo: tutorial en línea, epílogo: ¿existe un algoritmo simple para crear inteligencia?


En este libro, nos centramos en los detalles principales del dispositivo de red neuronal: cómo funcionan, cómo pueden usarse en problemas de reconocimiento de secuencias. Este material puede aplicarse directamente en la práctica. Pero, por supuesto, una de las razones del interés en NS es la esperanza de que algún día puedan ir más allá de los límites del simple reconocimiento de secuencia. ¿Quizás ellos, o algunos otros enfoques basados ​​en computadoras digitales, pueden ser utilizados en última instancia para crear máquinas pensantes que puedan competir o superar la inteligencia humana? Esta idea va mucho más allá del material discutido en el libro, o el conocimiento de cualquier persona en el planeta. Pero especular sobre este tema siempre es interesante.

Ha habido mucho debate sobre si las computadoras pueden, en principio, alcanzar el nivel de inteligencia humana. No consideraré este tema. A pesar del debate, creo que no hay dudas serias sobre la posibilidad de crear una computadora inteligente, aunque esta tarea puede ser extremadamente difícil y tal vez ir más allá de las tecnologías existentes, y los críticos actuales algún día se encontrarán en la posición de los vitalistas del pasado.

En cambio, quiero estudiar otra pregunta: ¿hay un conjunto simple de principios que puedan usarse para explicar un fenómeno como la inteligencia? En particular, más específicamente, ¿existe un algoritmo simple para crear inteligencia?

La idea de un algoritmo verdaderamente simple para crear inteligencia es bastante audaz. Ella probablemente suena demasiado optimista para ser verdad. Muchas personas tienen una sensación persistente e intuitiva de que el intelecto tiene una complejidad significativa que no se puede simplificar. Están tan impresionados con la increíble diversidad y flexibilidad del pensamiento humano que concluyen que es imposible que un algoritmo simple cree inteligencia. Pero, a pesar de esta intuición, no creo que valga la pena sacar conclusiones apresuradas sobre este tema. La historia de la ciencia está llena de ejemplos de cómo un fenómeno que inicialmente parecía extremadamente complejo fue explicado luego por un conjunto simple pero poderoso de ideas.

Considere, por ejemplo, los primeros días de la astronomía. Desde la antigüedad, se sabía que había una colección completa de diferentes objetos en el cielo: el sol, la luna, los planetas, los cometas, las estrellas. Estos objetos se comportan de maneras completamente diferentes: las estrellas, por ejemplo, se mueven majestuosamente y regularmente a través del cielo, mientras que los cometas parecen aparecer de la nada, volar por el cielo y desaparecer. En el siglo XVI, solo un ingenuo optimista podía imaginar que todos los movimientos de estos objetos podrían explicarse por un simple conjunto de principios. Pero en el siglo XVII, Newton formuló la teoría de la gravitación universal, que explicaba no solo todo este movimiento, sino también fenómenos terrenales, como las mareas y el comportamiento de las conchas asociadas con la Tierra. En retrospectiva, el optimista ingenuo del siglo XVI parece un pesimista que pide muy poco.

Por supuesto, en ciencia hay muchos más ejemplos de este tipo. Considere la gran cantidad de productos químicos que componen nuestro mundo, tan bellamente explicado por la tabla periódica, que a su vez se construye de acuerdo con varias reglas simples que se pueden obtener de la mecánica cuántica. O el misterio de la complejidad y diversidad del mundo biológico, cuyas fuentes, según parece, residen en el principio de evolución a través de la selección natural. Estos y muchos otros ejemplos dicen que no sería razonable descartar una explicación simple de cómo funciona el intelecto en función de lo que está haciendo nuestro cerebro, y cuál es el mejor ejemplo de inteligencia en la actualidad, parece muy complicado.

En este epílogo, supongo que una computadora puede considerarse razonable si sus capacidades coinciden o exceden las capacidades del pensamiento humano. Es decir, la cuestión de la existencia de un algoritmo de inteligencia es una cuestión de la existencia de un algoritmo que puede pensar de la misma manera que una persona. Vale la pena señalar que, en principio, puede haber formas de la mente que no incluyen pensamientos como los humanos, y al mismo tiempo de alguna manera interesante exceden las mentes de las personas.

Por otro lado, a pesar de todos estos ejemplos optimistas, lógicamente hablando, es posible que la inteligencia solo pueda explicarse a través del trabajo de una gran cantidad de mecanismos fundamentalmente diferentes. En el caso de nuestro cerebro, tales mecanismos podrían surgir como reacción a muchas solicitudes diferentes de la selección natural durante la evolución. Si este punto de vista es correcto, entonces la inteligencia implica una complejidad irreparable, y es imposible crear un algoritmo simple de inteligencia.

¿Cuál de estos dos puntos de vista es cierto?

Para profundizar en esta pregunta, hagamos una que esté estrechamente relacionada con ella, pero la otra: ¿hay una explicación simple de cómo funciona el cerebro humano? En particular, estudiaremos formas de cuantificar la complejidad del cerebro. El primer enfoque es el estudio del cerebro desde la perspectiva de una conexión . Estamos hablando directamente sobre las conexiones: cuántas neuronas en el cerebro, cuántas neuroglia, cuántas conexiones entre neuronas. Probablemente se haya encontrado con estas cifras antes: en el cerebro hay alrededor de 100 mil millones de neuronas, 100 mil millones de neuroglia y 100 billones de conexiones entre neuronas. Estos números son asombrosos. Y son atemorizantes. Si necesita comprender los detalles de todas estas conexiones (sin mencionar las neuronas y las neuroglia) para comprender cómo funciona el cerebro, definitivamente no obtendremos un algoritmo simple para la inteligencia.

Hay un segundo punto de vista más optimista sobre el cerebro, desde el punto de vista de la biología molecular. La idea es preguntar cuánta información genética se necesita para describir la arquitectura del cerebro. Para entender esto, comencemos observando las diferencias genéticas entre humanos y chimpancés. Probablemente se encontró con la afirmación común de que "los humanos son 98% de chimpancés". A veces los números varían del 95% al ​​99%. Estas variaciones ocurren porque inicialmente se compararon los números comparando muestras parciales del genoma del chimpancé humano, en lugar de todo el genoma. Sin embargo, en 2007, el genoma del chimpancé fue completamente secuenciado , y ahora sabemos que el ADN humano y del chimpancé difieren en aproximadamente 125 millones de bases de ADN emparejadas. Esto es de 3 mil millones de bases emparejadas en cada genoma. Entonces, no se puede decir que una persona es 98% chimpancé; sería más correcto hablar de 96%.

¿Cuánta información contiene 125 millones de bases emparejadas? Cada base emparejada se puede etiquetar con una de cuatro posibilidades: las "letras" del código genético, las bases adenina, timina, guanina y citosina. Por lo tanto, cada par se puede describir con dos bits de información, solo para identificar una de las cuatro etiquetas. Entonces, 125 millones de bases emparejadas equivalen a 250 millones de bits de información. ¡Esta es la diferencia genética entre humanos y chimpancés!

Por supuesto, estos 250 millones de bits son responsables de toda la diferencia genética entre humanos y chimpancés. Pero solo nos interesa la diferencia asociada con el cerebro. Desafortunadamente, nadie sabe cuánta diferencia genética puede describir la diferencia en el cerebro. Pero supongamos, solo por razones de claridad, que aproximadamente la mitad de los 250 millones de bits es responsable de esta diferencia. Resulta 125 millones de bits.

125 millones de bits es un número impresionantemente grande. Veamos cuánto es esto, traduciéndolo en términos más comprensibles. En particular, ¿qué tan grande sería un texto equivalente en inglés? Resulta que el contenido de información del idioma inglés corresponde a aproximadamente un bit por letra. Parece una calificación bastante baja, después de todo, el alfabeto tiene 26 letras, sin embargo, el texto en inglés contiene una gran cantidad de redundancia. Por supuesto, se puede argumentar que hay redundancia en el genoma, y ​​que dos bits en una base emparejada es una enumeración. Pero lo ignoraremos, porque en el peor de los casos, significa que sobreestimaremos la complejidad genética del cerebro. Suponiendo todo esto, veremos que la diferencia genética entre nuestro cerebro y el cerebro del chimpancé es equivalente a 125 millones de letras, o 25 millones de palabras en inglés. Esto es aproximadamente 30 veces más de lo que contiene la Biblia King James .

Una gran cantidad de información. Pero no incomprensiblemente grande. Cae en la escala de la mente humana. Quizás ni una sola persona pueda entender todo lo que está escrito en este código, pero un grupo de personas puede entenderlo colectivamente, utilizando la especialización adecuada. Y, aunque esta es una gran cantidad de información, resulta ser pequeña en comparación con la información necesaria para describir 100 mil millones de neuronas, 100 mil millones de neuroglias y 100 trillones de conexiones que existen en el cerebro. Incluso si usáramos una descripción simple y cruda, digamos, 10 números de punto flotante para describir cada conexión, eso requeriría 70 billones de bits. Esto significa que la descripción genética es 500 millones de veces menos compleja que la descripción del conectoma completo del cerebro humano.

A partir de esto, está claro que el genoma no puede contener una descripción detallada de todas nuestras conexiones neuronales. Tiene que describir solo la arquitectura general y los principios básicos que subyacen en el cerebro. Pero esta arquitectura y estos principios son suficientes para garantizar que las personas que crecen se vuelvan racionales. Por supuesto, esto no está exento de trucos: los niños en crecimiento necesitan un entorno saludable y estimulante y una buena nutrición para alcanzar el potencial intelectual. Sin embargo, si crecemos en un ambiente razonable, entonces una persona sana tiene un intelecto sorprendente. En cierto sentido, la información en nuestros genes contiene la esencia de cómo pensamos. Además, es probable que comprendamos los principios contenidos en esta información genética.

Las cifras dadas son estimaciones muy aproximadas. Es posible que 125 millones de bits resulten ser una exageración, y que haya un conjunto mucho más compacto de principios clave que subyacen en el pensamiento humano. Quizás la mayoría de estos 125 millones de bits son solo ajustes en relación con detalles menores. Y tal vez somos demasiado conservadores al calcular estos números. ¡Sería genial si ese fuera el caso! Para nuestros objetivos actuales, el punto clave será el siguiente: la arquitectura del cerebro es compleja, pero no tanto como se podría pensar al evaluar la cantidad de conexiones en el cerebro. Una mirada al cerebro desde el punto de vista de la biología molecular sugiere que las personas algún día podrán comprender los principios básicos que subyacen a la arquitectura del cerebro.

En los últimos párrafos, ignoré el hecho de que 125 millones de bits describen solo la diferencia genética entre el cerebro humano y el cerebro del chimpancé. No todas las habilidades de nuestro cerebro existen debido a estos 125 millones de bits. Los chimpancés mismos son buenos para pensar. Quizás la clave de la inteligencia reside principalmente en las habilidades mentales (y la información genética) que tienen los chimpancés y los humanos. Si es así, entonces el cerebro humano puede ser una pequeña mejora del cerebro del chimpancé, al menos en términos de la complejidad de los principios básicos. A pesar del chovinismo humano generalmente aceptado con respecto a nuestras capacidades únicas, esto no es tan increíble: las líneas genéticas del desarrollo de humanos y chimpancés divergieron hace solo 5 millones de años, un momento en una escala evolutiva. Sin embargo, en ausencia de argumentos más convincentes, me mantengo del lado del chovinismo humano generalmente aceptado: creo que los principios más interesantes que subyacen en los pensamientos humanos están contenidos en estos 125 millones de bits, y no en la parte del genoma que tenemos en común con los chimpancés.

La adopción del punto de vista sobre el cerebro inherente a la biología molecular nos da una reducción en la complejidad de nuestra descripción de aproximadamente nueve órdenes de magnitud. Esto es inspirador, pero no nos dice si es posible crear un algoritmo verdaderamente simple para la inteligencia. ¿Podemos reducir aún más la complejidad? Y, lo que es más importante, ¿podemos resolver la cuestión de la posibilidad de crear un algoritmo simple para la inteligencia?

Desafortunadamente, aún no hay suficientes pruebas convincentes para resolver este problema. Permítanme describir algunas de las pruebas disponibles con el truco de que esta revisión será breve e incompleta, y está destinada solo a darle una idea de algunos artículos científicos recientes, y no a describir completamente todo lo que se conoce en este momento.

Entre las pruebas que sugieren la posibilidad de un algoritmo simple para la inteligencia se encuentra el experimento, que se informó en la revista Nature en abril de 2000. Un equipo de científicos dirigido por Mriganka Sur "reflash" el cerebro de los hurones recién nacidos. Por lo general, las señales de los ojos de un hurón se transmiten a una parte del cerebro conocida como la corteza visual. Pero en estos hurones, los científicos redirigieron la señal para que entrara en la corteza auditiva, es decir, esa parte del cerebro que generalmente se usa para escuchar.

Para comprender lo que sucedió después de esto, debe comprender un poco en la corteza visual. La corteza visual contiene muchas columnas de orientación. Estas son pequeñas placas de neuronas, cada una de las cuales reacciona a la estimulación visual desde una determinada dirección. Se pueden representar en forma de pequeños sensores de dirección: cuando alguien ilumina la luz brillante desde una determinada dirección, se activa la columna de orientación correspondiente. Si la luz se mueve, se activa una columna de orientación diferente. Una de las estructuras de alto nivel más importantes de la corteza visual es el mapa de orientación, en el que se marcan las columnas de orientación.

Los científicos han descubierto que si la señal visual de los ojos del hurón se redirige a la corteza auditiva, entonces la corteza auditiva cambia. Las columnas orientales y un mapa de orientación comienzan a aparecer en la corteza auditiva. Resulta estar menos ordenado que el mapa de orientación en la corteza visual, pero está claro que este es. Además, los científicos realizaron las pruebas más simples de las reacciones de los hurones a los estímulos visuales, entrenándolos para responder de manera diferente cuando la luz venía de diferentes direcciones. A juzgar por las pruebas, los hurones aún podrían "ver", al menos rudimentariamente, utilizando la corteza auditiva.

Este es un resultado sorprendente. Él dice que cómo las diferentes partes del cerebro aprenden a responder a los datos sensoriales se basan en principios generales. Dicha comunidad proporciona argumentos a favor de la idea de la existencia de un conjunto de principios simples en el corazón de la mente. Sin embargo, no te engañes creyendo que la visión de los hurones en estos experimentos fue muy buena. Las pruebas de comportamiento probaron solo aspectos groseros de la visión. Por supuesto, no podemos preguntar a los hurones "si aprendieron a ver". Por lo tanto, los experimentos no probaron que la corteza auditiva reformada proporcionara a los hurones una visión de alta calidad. Por lo tanto, estos experimentos brindan un apoyo muy limitado a la idea de que principios similares están en el centro del aprendizaje de diferentes partes del cerebro.

¿Qué evidencia existe para refutar la existencia de un algoritmo simple para la inteligencia? Algunos de ellos provienen de los campos de la psicología evolutiva y la neuroanatomía. Desde la década de 1960, los psicólogos evolucionistas han descubierto una amplia gama de universales humanos, patrones de comportamiento comunes a todas las personas, en todas las culturas y de diferentes orígenes. Entre ellos están el tabú sobre el incesto de madre e hijo, el uso de la música y la danza, así como estructuras lingüísticas más complejas, como el uso de palabrotas (es decir, palabras prohibidas), pronombres e incluso estructuras básicas como verbos. Estos resultados se complementan con una gran cantidad de evidencia de neuroanatomía, de lo que se deduce que muchos patrones de comportamiento humano están controlados por ciertas partes del cerebro, y que estas partes del cerebro son similares en todas las personas. En conjunto, esto sugiere que muchos patrones de comportamiento muy especializados están cosidos en ciertas partes de nuestro cerebro.

Algunas personas sacan conclusiones de estos resultados de que se requieren explicaciones separadas para estas funciones cerebrales, y que como resultado, la actividad cerebral no puede simplificarse, es decir, no puede dar una explicación simple de cómo funciona el cerebro (y quizás crear un algoritmo simple para inteligencia). Por ejemplo, un conocido investigador de IA que sostiene esta opinión es Marvin Minsky . En las décadas de 1970 y 1980, desarrolló su teoría de The Mind Society, basada en la idea de que la mente humana es una gran comunidad de procesos computacionales simples pero muy diferentes, a los que llamó agentes. En su libro, que describe la teoría, Minsky resume todo lo que considera una ventaja de este punto de vista:
¿Qué truco nos hace inteligentes? El truco es que no hay foco. El poder de la mente surge de nuestra gran variedad, y no de ningún principio simple e ideal.


En respuesta a las críticas de su libro, Minsky especuló aún más sobre la motivación para escribir el libro, citando un argumento similar basado en la neuroanatomía y la psicología evolutiva:
Ahora sabemos que el cerebro mismo consta de cientos de sitios y núcleos diferentes, cada uno de los cuales tiene elementos y propiedades arquitectónicos significativamente diferentes, y que muchos de ellos están involucrados en la realización de aspectos claramente diferentes de nuestra actividad mental. , , , «» «» .


Minsky, por supuesto, no está solo en sostener este punto de vista; Le doy como ejemplo, al lado de tales argumentos. Encuentro interesantes tales argumentos, pero no creo que la evidencia a su favor sea lo suficientemente convincente. De hecho, el cerebro consta de una gran cantidad de áreas diferentes que realizan diferentes funciones, pero de esto no se deduce que sea imposible dar una explicación simple del cerebro. Quizás estas diferencias arquitectónicas surjan sobre la base de un principio básico común, así como los movimientos de los cometas, los planetas, el Sol y las estrellas surgen de una sola fuerza de atracción. Ni Minsky ni nadie más pudieron demostrar convincentemente la ausencia de tales principios.

Soy parcial a favor de la existencia de un algoritmo simple para la inteligencia. Básicamente, esta idea, a pesar de los argumentos poco convincentes presentados anteriormente, me gusta porque es optimista. En el caso de la investigación científica, el optimismo injustificado suele ser más productivo que el pesimismo justificado, ya que el optimista tiene el coraje de intentar probar algo nuevo. Este es el camino hacia el descubrimiento, incluso si no está descubriendo lo que originalmente esperaba. Un pesimista puede llegar a ser más "correcto" en el sentido estricto, pero abrirá menos que un optimista.

Este punto de vista contrasta fuertemente con la forma en que generalmente evaluamos las ideas, tratando de entender si son correctas o incorrectas. Esta es una estrategia inteligente para trabajar con estudios cotidianos o pequeños. Sin embargo, es posible evaluar de tal manera que las ideas grandes y audaces que definen un programa de investigación completo sean incorrectas. A veces solo tenemos pruebas débiles sobre la exactitud de la idea. Podemos negarnos humildemente a seguirlo y pasar todo nuestro tiempo examinando cuidadosamente la evidencia disponible, tratando de descubrir cuál es la verdadera. O simplemente podemos aceptar que hasta ahora nadie lo sabe con certeza y trabajar activamente para desarrollar una idea grande y audaz, dándonos cuenta de que aunque no tenemos garantías de éxito, solo de esta manera podemos expandir los límites de nuestra comprensión.

Dado todo esto, en su forma más optimista, todavía no creo que alguna vez encontraremos un algoritmo simple para la inteligencia. Más precisamente, no creo que alguna vez encontremos la oportunidad de escribir en Python (o C, o Lisp, o algo más) un programa muy corto, digamos, hasta mil líneas de código, que implemente inteligencia artificial. Y no creo que alguna vez encontremos una red neuronal descrita muy simple que pueda implementar IA. Pero creo que vale la pena actuar como si pudiéramos encontrar dicho programa o red. Este es el camino hacia las ideas, y después de eso, algún día podemos entender lo suficiente como para escribir un programa más largo o crear una red más compleja que demuestre inteligencia. Por lo tanto, vale la pena actuar como si hubiera un algoritmo extremadamente simple para la inteligencia.

En la década de 1980, Jack Schwartz , un destacado matemático e informático , fue invitado a un debate entre partidarios y escépticos de la IA. El debate se salió de control, los partidarios comenzaron a hacer declaraciones excesivas sobre cosas increíbles que estaban a punto de aparecer, y los escépticos solo fortalecieron su pesimismo, diciendo que la IA era simplemente imposible de crear. Schwartz estuvo presente fuera del debate y guardó silencio cuando la discusión se intensificó. Durante la pausa, se le pidió que hablara y describiera sus pensamientos sobre el tema en discusión. El dijo: "Bueno, antes de algunas de estas ideas, pueden suceder cien premios Nobel más". En mi opinión, esta es la respuesta perfecta. La clave de la IA son las ideas simples y poderosas, y podemos y debemos buscarlas de manera optimista. Pero necesitaremos muchas de esas ideas, ¡y todavía tenemos un largo camino por recorrer!

Source: https://habr.com/ru/post/464735/


All Articles