La solución al problema de entender el contexto de la inteligencia artificial. Parte 1
Comprender el lenguaje natural es una tarea completa de IA . Un aspecto de esta comprensión es entender el contexto. En este artículo, explicaré qué tipos de contexto deja de lado nuestra mente, cómo funciona con un tipo de contexto y cómo recreamos este proceso en nuestra tecnología de inteligencia artificial.El trofeo no cabe en la maleta marrón porque es demasiado [pequeño / grande].
¿Qué es también [pequeño / grande]?
Respuestas: La maleta / el trofeo.
El desafío del esquema de Winograd
El artículo anterior describió nuestro enfoque para el desarrollo de IA y lo que ya hemos hecho hasta ahora. Permíteme recordarte que creamos IA copiando directamente las estructuras y procesos de la psique humana.Dos tipos de contexto
De los comentarios sobre el artículo anterior, vimos que el término "contexto" se utiliza para describir situaciones muy diferentes. Consideramos este término, dividiéndolo en dos tipos.El primer tipo de contexto es cuando se trata de comprender los conceptos expresados en esta frase. Estas son situaciones de elegir uno de los significados de los homónimos, elegir un sinónimo, elegir uno de los matices del significado, etc. Por ejemplo: "Tenía los ojos llorosos cuando cortaba cebollas para una ensalada" y "El tiro con arco moderno se divide en varias direcciones". Una persona "sobre la marcha" entiende cuando se trata de cebollas, plantas y cuando se trata de cebollas, una variedad de armas.El segundo tipo de contexto es cuando para comprender es necesario destacar una determinada categoría, a menudo no representada en el texto en sí o no particularmente resaltada. Es esta categoría la que nos permite formular una cierta "idea", generalizando la expresión de lo que se dice.Por ejemplo, si en el libro de Lev Tolstoi te encuentras con la frase "Él imprimió una carta ...", para la comprensión correcta del texto usas la categoría "Siglo XIX" y concluyes que no se trata de una impresora. Este tipo de contexto implica que, para comprender e interpretar el texto, no solo se puede analizar todo el texto, sino también los datos asociados.Resolver problemas asociados con diferentes tipos de contextos son atendidos por procesos mentales completamente diferentes. Repetimos la misma división en nuestro desarrollo de IA. Al resolver los problemas del primer tipo, se utiliza un método basado en las características del almacenamiento de conocimiento. Al resolver problemas del segundo tipo, se implementa un algoritmo más complejo basado en la experiencia (en el caso de la inteligencia artificial, estamos hablando de algoritmos que compensan la falta de experiencia humana real en el sistema) y sugieren una mayor cantidad de cómputo.La psique humana a menudo trata primero de aplicar el primer método, porque Requiere mucho menos recursos informáticos. Si la solución no parece adecuada, entonces la psique usa la segunda. Además, cuanto mayor es la inteligencia, más a menudo se usa el segundo método y mayor es el número de contextos posibles tomados en cuenta. Los niños, en vista de la complejidad y la intensidad de los recursos del segundo método, así como los adultos que no están acostumbrados al trabajo mental, prefieren el primero.Describiremos cómo funciona nuestra tecnología de inteligencia artificial con el primer tipo de contexto. La forma en que trabajamos con el segundo, más complejo, se describirá en el próximo artículo.Ya es esa trenza que tiene menos ataduras
Para ilustrar, tomemos una situación de diálogo:"Estoy caminando por el paseo marítimo y vi una guadaña. Me pregunto qué trenza es la más larga.Una solución construida en redes neuronales, debido a las limitaciones impuestas por el método en sí, lo más probable es que no pueda responder adecuadamente. Incluso si se cargan muchos textos en la Asamblea Nacional para buscar una respuesta, entonces, según la probabilidad, sonará la cifra "5.6 metros".Permíteme recordarte que desarrollamos nuestra tecnología de IA copiando secuencialmente la psique y sus procesos. La red semántica que utilizamos para almacenar conocimiento refleja las peculiaridades del almacenamiento humano y el procesamiento de la información. Por lo tanto, dentro del marco de nuestro enfoque, el problema se resuelve de manera bastante simple.En una solución correspondiente a la edad de siete años, el algoritmo accede a la red semántica y encuentra el vértice que se encuentra en el nodo al que pertenecen las palabras escuchadas anteriormente. En el ejemplo anterior, es necesario elegir uno de los homónimos correctamente: una trenza (herramienta), una trenza (peinado) y una trenza (franja de tierra conectada a la costa). Para hacer esto, se analiza qué nodo de la red semántica se discutió anteriormente. Es decir Se realiza el procedimiento más simple para calcular la distancia mínima a los conceptos utilizados en el texto anterior. En nuestra red, la distancia es una función del número de conexiones (en proporción directa) y su probabilidad (inversamente).
La distancia desde la "trenza (franja de tierra)" hasta el "terraplén" será dos órdenes de magnitud menor que desde la "trenza (peinado)" a cualquiera de estos conceptos. AI dará la respuesta "110 km".Cabe señalar que este problema también se resuelve de la segunda manera, con la separación de la categoría, por ejemplo, "Río Volga, al lado del cual nuestro interlocutor".Los motores ven las maletas de manera diferente
Veamos un ejemplo del esquema de Vinohrad al comienzo del artículo:“El trofeo no cabe en la maleta marrón porque es demasiado pequeño. ¿Qué es demasiado pequeño?
La conexión entre "no encaja" y la combinación de "demasiado pequeño" - "maleta" es un orden de magnitud más probable que entre "no encaja" y "demasiado pequeño" - "trofeo". AI dará la respuesta "maleta".La presencia de una alta probabilidad de tal relación, que supone un orden de magnitud menor distancia en la cadena "no encaja" - "demasiado pequeño" - "maleta", se debe a la experiencia humana. Como la mayoría de las personas, a menudo me encuentro con una situación en la que algo no cabe en una maleta, ya que es demasiado pequeña. Por lo tanto, tengo esa conexión. Las mismas conexiones se forman en el proceso de aprendizaje de IA (describiremos con más detalle sobre la formación de varios tipos de conexiones en la psique en uno de los siguientes artículos sobre nuestra red semántica)."El trofeo no cabe en la maleta marrón porque es demasiado grande". ¿Qué es demasiado grande?
La conexión entre "no encaja" y la combinación de "demasiado grande" - "trofeo" es mucho más probable que entre "no encaja" y "demasiado grande" - "maleta". AI dará la respuesta "trofeo".Noto una característica: en los motores, que a menudo se encuentran con una situación en la que necesitas poner una maleta demasiado grande, la psique usa el segundo método para comprender el contexto. Porque para ellos, el enlace "demasiado grande" - "maleta" es más relevante. Al mismo tiempo, otro sistema funciona para los turistas, junto con un aumento en la experiencia de situaciones en las que es difícil colocar una maleta en algún lugar, la imposibilidad de construcción aumenta "no se puede poner algo en una maleta porque la maleta es demasiado grande".Para una solución correspondiente a 12 años de edad, la fórmula es algo más complicada. Además, el enfoque formado a esta edad también se implementa en un adulto: después de 12 años, esta parte de la red de algoritmos no se vuelve más complicada.De hecho, la facilidad de decisión está determinada por los detalles de nuestro viaje. Todas las situaciones relacionadas con la comunicación, todas las lingüísticas, se forman con la participación de las estructuras de la psique humana. En realidad, todos los detalles en el campo del lenguaje están determinados por estas estructuras. Es cierto que hay un proceso inverso, cuando el lenguaje determina la estructura. Hay conmoción cerebral mutua. No es sorprendente que con la ayuda de estas estructuras (mentales) los problemas que surgen se resuelvan de la manera más fácil. La tuerca debe desenroscarse con una llave inglesa, se crean entre sí. No una cucharaObservo que, además de las grandes ventajas, nuestro enfoque para el desarrollo de IA presenta algunas dificultades. La arquitectura computacional no corresponde a la base fisiológica, y periódicamente resolvemos problemas técnicos para la visualización cualitativa de procesos y estructuras de la psique en forma digital. Además, debido a los supuestos y ajustes existentes, algunos de los recursos se gastan en asegurar la identidad de la red semántica y los algoritmos de inteligencia artificial a las estructuras y algoritmos de la psique real.El siguiente artículo tratará sobre el segundo tipo de contexto y, desafortunadamente, será mucho más pesado. No podemos prescindir de una inmersión profunda en los procesos psicológicos al describir algoritmos para trabajar con el segundo tipo de contexto en nuestra tecnología.Source: https://habr.com/ru/post/es399111/
All Articles