El Diccionario de William Shakespeare tiene 12,000 palabras. El diccionario del negro de la tribu caníbal "Mumbo-Yumbo" es de 300 palabras. Ellochka Schukin del libro "12 sillas" cuesta fácil y libremente treinta.
El hombre entiende fácilmente a Ellochka. Por desgracia, Shakespeare preferiría entender una computadora que Ellochka. Es suficiente para que comprendamos el contexto y la entonación (descubriremos el resto) y la computadora necesita claridad en cada término. Preferiblemente sin sinónimos. Cuantas más imágenes se esconden detrás de cada palabra, más difícil es de entender. La naturaleza dependiente del contexto de las palabras humanas es solo una de las dificultades para enseñar inteligencia artificial en lenguaje natural. Si puede distinguir las cebollas comestibles de las cebollas picantes si tiene una descripción completa de la situación, entonces la negación del significado por ironía o preguntas retóricas se reconoce solo por entonación. La sintaxis y el orden de las palabras en una oración crea una complejidad adicional.
Igor Mordach, un empleado del laboratorio de inteligencia artificial American OpenAI, sin embargo, decidió que el lenguaje Ellochkin está lejos de ser un callejón sin salida, pero es un ejemplo muy adecuado, en el que los bots construirán un lenguaje para su comunicación y luego nos entenderán. Solo 30 palabras para la computadora Ellochka lamentó. En su
experimento, un programa de computadora creó el lenguaje desde cero.

En busca de un lenguaje universal para comunicarse con las máquinas.
La precisión del reconocimiento del lenguaje natural ahora entre los líderes de los sistemas cognitivos (IBM Watson, Google, ABBYY, Microsoft, Nanosemantics) nos permite comprender en general el significado y responder una pregunta escrita con una base de conocimiento de materia predeterminada, pero una conversación incluso con un 90% de precisión de reconocimiento de frase es en realidad Muy agotador. El discurso conversacional, saturado de interjecciones y que a menudo tiene lugar en una gran empresa con la intersección de diálogos, pone al robot en su capacidad de mantener la conversación al nivel de un niño de tres años.
La capacidad de los programas para responder con precisión al significado de las frases resolvería muchos problemas de interfaz, lo que significa conectar bots (agentes de inteligencia artificial) a cualquier tarea humana cotidiana. Incluso ahora hay un diálogo con las máquinas: la televisión, por ejemplo, se comunica en el lenguaje de control remoto. Pero entiende muy pocos equipos. Y los comprende solo después de la programación. A partir de este sencillo ejemplo, está claro que para una comunicación rápida y flexible con programas y dispositivos multipropósito (al menos robots), los intermediarios deben ser eliminados del diálogo. Entre los cuales, por desgracia, hay programadores.
Los optimistas de la lingüística informática asocian las esperanzas con las redes neuronales. Según ellos, el único problema es la necesidad de procesar una gran cantidad de ejemplos. Los opositores consideran que la tarea no tiene solución. No tanto por la escala del entrenamiento, sino por la equivalencia de esta tarea con la tarea de crear conciencia en las máquinas. Cada una de las partes interpreta ejemplos de contar delfines o comunicar a los monos para su beneficio, algunos como una perspectiva, otros como un callejón sin salida. Para aquellos interesados en detalles sobre Habré y GT, hay muchas publicaciones sobre lenguaje natural. Por ejemplo,
"Introducción al reconocimiento del lenguaje natural" .
El tema de esta publicación es el tercer enfoque, tomado como base por Igor Mordach: deje que las máquinas primero aprendan a comunicarse en el lenguaje que crean. El proceso de desarrollo de su lenguaje permitirá a los agentes de software de inteligencia artificial comprender mejor el algoritmo para ajustar los términos a nuevos significados, reglas de formación de frases y utilizar este conocimiento para las conversaciones con las personas. Esto es exactamente lo que Mordach, quien anteriormente trabajó como especialista en la creación de héroes de películas de robots en movimiento, estableció la tarea. Con estos antecedentes en mente, Igor decidió que el entrenamiento en movimientos contiene algoritmos para recopilar información y su uso simultáneo parcial, que puede usarse en cualquier entrenamiento.
Para enseñar a los bots el lenguaje de los bots (agentes de software), los colocaron en el universo condicional del "cuadrado blanco", les establecieron objetivos, energía de movimiento y la capacidad de procesar la experiencia de relacionarse con el objetivo. Inicialmente, los bots tenían un conjunto mínimo de comandos de acción, experiencia personal de éxito, y también daban una forma de intercambiar información, a través de un "contacto táctil" cercano o mediante un prototipo remoto de "audición y vista" (aquí es más apropiado usar el término dirección de flujo de información). El propósito de los bots en el universo condicional del "cuadrado blanco" era alcanzar cierto punto para usted, decirle su objetivo a otro agente, intercambiar objetivos, empujar a otro agente al objetivo en ausencia de intercambio de información entre ellos. Los objetivos y los bots diferían en color o tamaño.
Para el Agente Smith, la matriz, cuando fue creada por Mordach, se vería así:

En el experimento OpenAI, el parámetro medido del éxito de prueba y error fue el hecho y la velocidad de alcanzar los objetivos. Podrían ser la inacción o el movimiento de un determinado punto (contacto directo con el objetivo o contacto a través de otros agentes) en el mundo virtual del cuadrado blanco. Cuanto más rápido se logró el objetivo, más útil fue la lista de términos utilizados en el diálogo de objetivos actuales. Los objetivos y el éxito fueron tanto individuales como colectivos.
En el proceso de completar las tareas, los bots enriquecieron la reserva lingüística con nuevos conceptos convencionalmente correspondientes a los humanos, desde los términos de movimiento hasta los conceptos: arriba, abajo, a la derecha, a la izquierda. Mordach espera que al establecer las reglas para la formación de palabras, los bots puedan "entender" más fácilmente las mismas reglas en los idiomas humanos. Incluyendo aprender la precisión del uso de términos comparativos e indefinidos. AI tiene una comprensión pobre de términos abstractos y generalizados. Más precisamente, no comprende nada en absoluto, pero está listo para trabajar con algunas frases, y para otras es necesario obtener información aclaratoria. En la expresión "el automóvil va rápido", al menos la palabra "rápido" - debe medirse. Incluso en términos de reglas de tráfico, "rápido" sigue siendo una matriz de valores que se ajustan a algún intervalo. Más precisamente, varios intervalos: para la ciudad, las autopistas y las zonas rurales.
Las redes neuronales, por supuesto, saben cómo trabajar con términos vagos, pero su entrenamiento generalmente no comienza desde cero, contiene una serie de reglas de procesamiento de inicio y tampoco depende de la acumulación de experiencia de señalización en el tipo de canal a través del cual se transmite la información. Estas son las principales novedades de los experimentos de Mordach.
Comparación de comunicaciones remotas y comunicación táctil de bots:


La falta de cuerpo y límites hace que todos estos términos sean condicionales, por supuesto.
Un punto notable es que el éxito de cada bot se calculó como una fracción del éxito de todos los bots, fomentando la cooperación para lograr el objetivo. Es decir, la calidad del vocabulario se estimó por la totalidad del lenguaje utilizado. Resulta que alguien tenía que recopilar e informar necesariamente las circunstancias secundarias para lograr el objetivo, lo que en el caso del cumplimiento individual de los objetivos por parte de cada operador evitaría que se lograran. La regla estadística 20/80: recibir el 20% de la información proporciona el 80% del logro de la meta, funciona a nivel de un sujeto individual, pero en un equipo alguien siempre debe dar su 100% de la información recopilada a un 1% adicional para lograr la meta.
Todos los casos de comunicación de contacto "verbal" y "no verbal" de bots durante el estudio de Mordach se muestran en el video:
Matriz artificial y discreta como resultado de la comunicación bot
La idea principal de Mordach es asegurarse de que al comprender el "mundo circundante", los bots creen el lenguaje necesario para esta comprensión. En su concepto, el lenguaje es el resultado de la acción. Otros científicos llaman la atención sobre el hecho de que un lenguaje desarrollado y la capacidad de comunicarse sobre temas abstractos permitirán a las máquinas crear sus propias ideas, describir y crear nuevas entidades que antes no existían. No está lejos de la transformación de nuestro mundo.
La capacidad de comprender el lenguaje natural se considera estrechamente relacionada con la presencia de conciencia en el tema de la comunicación. ¿La capacidad de comprender el significado de lo que se ha dicho conducirá al surgimiento de la conciencia en las máquinas? Quizás solo una persona con una creación similar a la humana pueda comprender completamente el lenguaje natural, y la creación de un lenguaje bot en su propio entorno conducirá a bots inteligentes en esta o aquella versión del Agente Smith.
Establecer prioridades de bots durante el entrenamiento es contrario al principio de ingeniería de confiabilidad y previsibilidad de la operación de la máquina. La imprevisibilidad de las prioridades, la capacidad de fantasear, la autoeducación, el secreto de la comunicación entre bots para humanos ya se han hecho sentir en
experimentos anteriores de OpenAI. Sin un objetivo final vinculante, los programas tuvieron prioridades inesperadas durante el curso de sus estudios. En el experimento en regatas virtuales, la implementación de tareas relacionadas para bots se volvió más rentable que 1 lugar y, en general, completó la carrera hasta el final. El cumplimiento de las tareas asociadas trajo un 20% más de puntos.
Es familiar, ¿no es así? Robert Sheckley describió esto hace 65 años en la famosa historia "The Guardian Bird", que pasó de la prevención de asesinatos a bloquear cualquier actividad en la Tierra, ignorando otras prioridades y tareas para el principal:
Jackson bostezó y detuvo el auto en la acera. No notó un punto brillante en el cielo. No necesitaba tener cuidado. De hecho, de acuerdo con todas las nociones humanas, no planeó asesinatos en absoluto.
Extendió la mano, quiso apagar el encendido ... Y algo lo arrojó contra la pared de la cabina.
"Un tonto de hierro", dijo a un pájaro mecánico que se cernía sobre él. El auto no está vivo. No quiero matarlo en absoluto.
Pero el pájaro guardián sabía una cosa: algunas acciones cesan la actividad del cuerpo. El automóvil, por supuesto, es un organismo activo. Después de todo, está hecho de metal, como el pájaro guardián, ¿no? Y mientras te mueves ...
Un exceso de crear su propio lenguaje en bots puede ser la creación de su propio universo virtual. Al menos en la historia de la humanidad, existen tales precedentes. Para citar a Tolkien:
La invención de los idiomas es la base de mi trabajo. Las "Historias" se escribieron más para crear un mundo para estos idiomas, y no al revés. Para mí, la palabra aparece primero, y luego la historia asociada con ella. Prefiero escribir "élfico". Pero, por supuesto, un libro como El Señor de los Anillos se sometió a una edición seria, y dejé allí tantos "idiomas" como el lector podía digerir (aunque ahora descubro que a muchos les gustaría más). [...] En cualquier caso, para mí es en muchos sentidos un ensayo sobre "estética lingüística", ya que a veces respondo a personas que me preguntan sobre qué escribí mi libro.
El hecho de que las máquinas comenzarán a pensar antes de lo que entendemos también es temido en OpenAI. Si los bots también tienen su propio idioma, entonces la gente seguramente perderá este momento. Por lo tanto, la tarea de Mordach no es solo crear el lenguaje de un bot, sino también crear un traductor humano. Primero, por supuesto, en inglés.
Respondiendo a tales temores, Igor cita un conocido experimento de pensamiento en el campo de la filosofía de la conciencia y la filosofía de la inteligencia artificial llamada la
"sala china" , publicada por John Searle en 1980. La esencia de la declaración de Searle es que cualquier comunicación completa es teóricamente completamente posible sin conciencia, pero usando reglas bastante detalladas para interpretar las preguntas del interlocutor para obtener respuestas. La conclusión más general de Searle sugiere que cualquier manipulación de construcciones sintácticas no puede conducir a la comprensión.
En tal contexto, el propio lenguaje y el propio universo virtual no significan en absoluto la presencia de conciencia entre sus agentes y objetos. Como en los juegos de computadora. O, como algunos creen, como una persona cuya conciencia es solo una puerta de enlace semántica entre un lenguaje "artificial" claro dentro del cerebro y el ruido natural de las señales del mundo exterior.