Desarrollando una IA fuerte copiando las estructuras y procesos de la psique humana.
En este artículo de revisión, hablo sobre mi experiencia en el desarrollo de inteligencia artificial (recreación de la psique humana), qué resultados se han logrado (procesos cognitivos humanos básicos, entiende el texto y puede hacer preguntas aclaratorias) y en qué soluciones la tecnología es aplicable en esta etapa de desarrollo (la IA ya está lista) reemplace a consultores en línea en vivo y puede ser un asistente virtual para programadores).Comprensión en el contexto de la IA
La comprensión es una de las habilidades importantes de la inteligencia. La importancia del concepto de comprensión para la inteligencia artificial se puede rastrear en las ideas de Alan Turing, Marvin Minsky y Ray Kurzweil.Según Wikipedia, "la comprensión es una operación universal de pensamiento asociada con la asimilación de nuevos contenidos, su inclusión en el sistema de ideas e ideas establecidas" . Creemos que la clave de esta formulación es la necesidad de que la IA tenga un "sistema de ideas e ideas establecidas". Para que la IA entienda cómo es una persona, el sistema de conocimiento de la IA debe ser idéntico o muy cercano al sistema de conocimiento humano. De lo contrario, la persona será percibida, pero no será entendida.Desde el punto de vista práctico, la implementación de la comprensión en IA ofrece oportunidades:- enseñar a AI una variedad de contenido creado por man for man;- interactuar con AI en un lenguaje natural;- Recibir conclusiones de AI que se basan en la comprensión de "como un ser humano" (la respuesta "42" no siempre es lo que necesitamos).Por lo tanto, adoptamos el concepto de Comprensión como el principal en nuestro enfoque para el desarrollo de la IA.Los principales enfoques para el desarrollo de IA son "de arriba hacia abajo" y "de abajo hacia arriba"
Hay dos enfoques principales para el desarrollo de IA. El primero está dirigido a reproducir las habilidades cognitivas de una persona en una computadora sin recurrir al nivel de neuronas individuales. Este enfoque se llama de arriba hacia abajo. El segundo enfoque tiene como objetivo construir inteligencia desde las neuronas hasta los niveles generales de los procesos cognitivos, y se denomina, respectivamente, "de abajo hacia arriba".En cuanto a las tendencias generales en el desarrollo de la IA, ahora prevalece el enfoque ascendente. Probablemente el aparato matemático utilizado en redes neuronales artificiales es más comprensible para científicos, desarrolladores, entusiastas.Utilizamos el primer enfoque: "de arriba hacia abajo". Por lo general, esta dirección del desarrollo de la IA se complica por la falta de una teoría general, más o menos armoniosa, consistente e integral de los procesos mentales humanos.Reuní un equipo para trabajar en una teoría de este tipo en 2003, y aún para fines no relacionados ni con la inteligencia artificial ni con la tecnología de la información en general. Un grupo de psicólogos y psicoterapeutas académicos y practicantes se propuso racionalizar los conceptos teóricos y los métodos prácticos disponibles en psicología. Tuve que revisar críticamente todo el conocimiento científico disponible sobre este tema. Más de 30 personas participaron en el proyecto en varias etapas.En 2008, desarrollamos el llamado El modelo de la psique es un concepto coherente de la organización de la psique y los procesos en él. El modelo resultó ser complejo en vista de la gran cantidad de elementos que interactúan, pero también hubo una ventaja: estaba bien algoritmizado. Es decir El modelo funciona con algunos elementos y describe la naturaleza de su interacción de acuerdo con leyes matemáticas comprensibles.Los resultados de desarrollo se han probado en varias soluciones de productos. En particular, modelamos el comportamiento de los usuarios de Internet al elegir un artículo de noticias, al elegir un resultado de los resultados de búsqueda, y también distribuimos usuarios a grupos de consumidores de diferentes tipos de productos según necesidades simuladas. Como datos de entrada para el modelado, utilizamos el historial de visitas a sitios de cada usuario individual. Por cierto, estos datos son suficientes para calcular unas cien características de una persona con la que opera un psicólogo: extraversión, compulsividad, etc. El género también es una característica psicológica, pero no para todos los países. Por ejemplo, para Suecia, la precisión de la determinación es de un máximo del 65%,mientras que para los países de Europa del Este podemos determinar el género del usuario en función del historial de navegación con una precisión del 95%.Entendemos bien qué procesos ocurren en la psique, tenemos herramientas que nos permiten estudiar y analizar estos procesos. Utilizamos el método fenomenológico (1). Este método le permite resaltar los procesos de la psique, separarlos entre sí y observar la dinámica. Para nosotros, la psique no es una caja negra, en su mayor parte es una estructura compleja, pero comprensible.También noto que el enfoque de nuestro equipo implica la universalidad de la IA que se está desarrollando, en contraste con la IA especializada enfocada en resolver los mismos problemas.Almacenamiento y procesamiento de conocimiento en IA
La primera tarea que comenzamos a resolver es el desarrollo de una red semántica para almacenar el conocimiento en la forma en que se almacena en la psique humana. Al mismo tiempo, la estructura de la red semántica debería proporcionar no solo almacenamiento de datos, sino también la operación eficiente de algoritmos que repiten procesos cognitivos y de otro tipo.Los vértices de la red son cualquier fenómeno que la conciencia pueda resaltar. Los vértices vienen en diferentes formas, por ejemplo, un objeto, una acción, un signo, un concepto abstracto. Ejemplos de picos son laptop, vela, negro, espacio.Las conexiones entre los vértices reflejan el tipo de interacción de estos fenómenos en la psique. En la expresión "bola azul" entre los dos picos "azul" y "bola" hay una conexión caracterológica. Los enlaces también pueden ser de varios tipos.En su trabajo sobre la formación de estructuras de redes semánticas, es decir. Para agregar nuevos tipos de picos y conexiones, seguimos el proceso de ontogénesis de las funciones cognitivas humanas. Aclaramos esto con un ejemplo. Hasta cierto punto, no existe una conexión "instrumental" entre los fenómenos en la psique, porque la psique no resuelve los problemas correspondientes: un niño puede golpear un juguete con su omóplato y no percibe el omóplato como un instrumento. Después de un tiempo, imitando lo que se vio y acumulando conocimiento, se forma un nuevo tipo de conexión en la psique: instrumental, el niño comprende que puede cavar con una pala. Por lo tanto, la psique responde a la complejidad de las operaciones, a un aumento en la cantidad de datos, y optimiza su trabajo formando un nuevo tipo de conexión.La formación de nuevos tipos de comunicación tiene lugar en relación con un nuevo tipo de actividad y en relación con la aparición de neoplasias en la psique (2) Un ejemplo de un nuevo tipo de actividad: con un diseñador profesional, el color no es solo una característica, sino también una herramienta profesional que forma un tipo de conexión por separado. Un ejemplo de neoplasia en la psique es el pensamiento abstracto.En primer lugar, identificamos dos etapas en la formación de la psique: preverbal, cuando se forman estructuras para las que no se usan palabras (desde el nacimiento hasta los 2 años), y verbal, cuando la palabra se usa como identificador. La división en las etapas indicadas es condicional, ya que cada una de ellas también tiene sus propios períodos separados de formación de estructuras.La reproducción de estructuras preverbales resultó ser una tarea bastante difícil. Nos vimos obligados a reconstruir conceptos y conexiones a partir de estructuras que conocemos en etapas posteriores. Por ejemplo, el placer de un niño de seis meses aún no contiene experiencias diferenciadas (ya sea placer sexual, placer de saciedad, placer de intimidad, etc.). En el desarrollo de estructuras preverbales, nos limitamos a aquellos que tienen conexiones con estructuras formadas en etapas posteriores. Tenga en cuenta que aunque la metodología para la formación de estructuras preverbales para la red semántica se ha desarrollado, esta tarea requiere una gran cantidad de trabajo de los psicólogos. En esta etapa, identificamos 3 tipos de vértices y 4 tipos de conexiones.Tan pronto como una palabra se convirtió en el principal identificador de información, se hizo más fácil formar estructuras. Siempre puede recurrir a la fuente, la psique misma, haciendo preguntas a una persona de la edad adecuada. Tenga en cuenta que en la etapa verbal, la psique no se limita a un aumento extenso en el número de fenómenos. También aparecen nuevos tipos de fenómenos, por ejemplo, abstractos, ficticios, etc., que conllevan un cambio en la estructura de la red.Hasta la fecha, hay una serie de desarrollos que buscan repetir el principio del almacenamiento del conocimiento por parte del hombre utilizando la red semántica. Nuestro método para formar la estructura de la red se basa en las herramientas que desarrollamos para el estudio de los procesos mentales (incluidos los cognitivos). Introdujimos en la estructura de la red solo lo que está realmente disponible en la psique de la edad correspondiente. Como resultado, la red semántica que recrea la estructura cognitiva de la psique de un niño de siete años contiene 17 tipos de vértices y 15 tipos de comunicación. A esta edad en los humanos, la mayoría de las formas de comunicación ya se han formado.En el proceso de creación de una red semántica, identificamos varias características interesantes:1.La red semántica tiene algunos trucos: elementos que determinan la distribución desigual de las relaciones. A su alrededor, la mayoría de las cadenas de estos enlaces están orientadas. Estas son necesidades humanas.2. Con cada neoplasia, la estructura del conocimiento se reconstruye. El nuevo período de edad trae la necesidad de cambiar significativamente la estructura de las relaciones entre los elementos.3. Creando algún tipo de red de referencia, registramos diferencias personales. Estas diferencias son típicas. Es decir, el número de invariantes es muy limitado y se debe a características individuales o la influencia del medio ambiente. Estos son tipos psicológicos.Adquirir nuevos conocimientos y formar respuestas a las preguntas.
Los algoritmos que implementan operaciones de pensamiento relacionadas con la comprensión de nuevos conocimientos se basan en la estructura de la red semántica.Inicialmente, el texto es procesado por un analizador desarrollado en la Universidad de Stanford.. Luego verificamos la disponibilidad de los vértices y conexiones correspondientes y, si es necesario, formamos nuevos. Al formar una respuesta o una pregunta aclaratoria, los algoritmos se guían por los datos disponibles en la red semántica. La operación simplificada de los algoritmos se puede demostrar mediante el siguiente ejemplo. Después de leer el texto "Los osos polares se aprovechan de las focas", AI, conozcamos cada uno de estos fenómenos por separado, crea una conexión especial en la red semántica que fija la exclusividad: son los osos polares los que se aprovechan de las focas. Después de recibir la pregunta, "¿Los osos pardos se aprovechan de las focas?" La IA responderá "No", porque no habrá una estructura en la red semántica que cumpla con todas las condiciones especificadas "Oso pardo caza focas".En la primera etapa, desarrollamos algoritmos correspondientes a los procesos cognitivos de un niño de tres años. Basado en los algoritmos, escribimos un programa que puede entender un texto muy simple y responder varios tipos de preguntas, aquí hay un programa de demostración . El programa nos permitió configurar las conexiones de la red semántica en grandes cantidades de datos y confirmó la correspondencia directa de la reacción del sistema y la psique de una persona viva.En septiembre, completamos el modelado de los procesos cognitivos de un niño de siete años. Si bien no tenemos los recursos para programar todo el sistema, por lo tanto, nos limitamos temporalmente a una red semántica y a varios tipos de algoritmos. Si los algoritmos en este nivel se pueden calcular "manualmente", entonces esto no se puede hacer con la red semántica: contiene alrededor de 10,000 vértices y 40,000 enlaces. Después de que terminemos de programar todos los algoritmos, esta solución será un sistema cognitivo suficientemente poderoso para trabajar con información textual. Nuestro sistema puede proporcionar una comprensión de los nuevos conocimientos descritos en el lenguaje natural y que funcionan al mismo nivel que una persona de la edad adecuada.Próximos pasos de desarrollo
El siguiente paso en el desarrollo de nuestra tecnología lo vemos en la reconstrucción del pensamiento abstracto del hombre. Ahora la IA puede operar con conceptos abstractos que se le enseñaron, pero no puede formar independientemente otros nuevos. Por ejemplo, aquí está el texto utilizado para enseñar a los peces: elpescado es un animal. El pez tiene cuerpo alargado. El pescado tiene el cuerpo aplanado. El pez tiene cabeza, mandíbulas, branquias, cola, escamas plateadas. El pez vive en el agua. Los peces pueden nadar, dormir, comer, sentir dolor, miedo. El pez no habla. Si el pescado está fuera del agua, entonces muere. El pescado usa branquias para respirar. El pez usa aletas para nadar. Salmón, trucha, tiburón son peces. Gato, oso, coyote, cocodrilo, foca, pez caza pelícano.La formación independiente de conceptos abstractos ampliará significativamente las posibilidades de enseñar IA y el alcance de su uso. Ya hemos desarrollado los principios básicos y estamos planeando detallar los procesos en el futuro cercano. Agregar pensamiento abstracto también requerirá la modernización de la red semántica como Se agregarán nuevos tipos de comunicación.Además, planeamos desarrollar algoritmos para la formación independiente de nuevos tipos de comunicación mediante inteligencia artificial. Esto agregará flexibilidad a la red semántica y cierta "autonomía" en el entrenamiento de IA por parte de un equipo de expertos.Aplicación de tecnología AI
La solución desarrollada es capaz de comprender texto simple, por ejemplo, el sistema puede entender la mayoría de los artículos de Wikipedia en inglés simple . Además, nuestra solución puede responder preguntas sobre el conocimiento existente y hacer preguntas aclaratorias si encuentra una contradicción. A partir de las restricciones en esta etapa, los textos y las preguntas deben construirse gramaticalmente correctamente. Además, el sistema debe ser entrenado por nuestros expertos en conceptos abstractos en una nueva área temática. Con este enfoque de aprendizaje, la solución desarrollada es indistinguible en el diálogo de una persona real.De las características de nuestro enfoque de aprendizaje, no hay necesidad de una gran cantidad de datos de capacitación. Nuevos conceptos abstractos y nuevos conocimientos en un área temática específica, el sistema se entrena mediante una sola lectura del texto.Los procesos cognitivos recreados en nuestra IA ya son suficientes para su uso en bots inteligentes, soporte de texto en línea, NPC en juegos, etc. Es decir en sistemas en los que es necesaria la comunicación en un área temática separada en lenguaje natural. Ahora las respuestas en tales decisiones están formadas por declaraciones en vivo o guiones. Nuestro sistema forma una respuesta a partir del conocimiento existente de la misma manera que lo hace una persona.Podemos agregar ciertos tipos de algoritmos cognitivos y entrenar el área temática correspondiente, para que la IA pueda realizar, por ejemplo, tareas de programación de nivel de entrada. Este es un asistente virtual que asumirá parte de las tareas de programación de rutina: comprenderá la tarea en un lenguaje natural, analizará el código existente y escribirá uno nuevo. En primer lugar, estamos hablando de problemas algorítmicos con una buena formulación y con un bajo grado de incertidumbre.Los recursos propios ya no son suficientes, por lo tanto, estamos considerando una asociación con otras empresas. Podemos proporcionar completamente la parte tecnológica para productos o plataformas, y por parte de los socios esperamos ver la experiencia del producto y los recursos para la implementación en código. El equipo también estará contento con los desarrolladores que estén cerca de las ideas presentadas en el artículo.En los comentarios, escriba sobre los aspectos de la tecnología que le gustaría saber más, en los siguientes artículos intentaré tener esto en cuenta.1. Husserl E. Estudios lógicos. / Per. con el E. A. Bernstein, ed. S. L. Frank. Nueva edición de R. A. Gromov. - M .: Proyecto académico, 2011.2. Piaget J. Discurso y pensamiento de un niño. - M., 1994.Source: https://habr.com/ru/post/es398779/
All Articles