SpaceFusion: Estructuración de espacio oculto no estructurado para IA interactiva

La paleta permite a los artistas organizar y mezclar pinturas de diferentes colores, creando pinturas en lienzos frente a ellos. La existencia de una herramienta similar que podría permitir a AI aprender juntos de varias fuentes de datos, como conversaciones, historias, imágenes y conocimiento, podría abrir la puerta a investigadores y científicos para desarrollar sistemas de IA más completos.


La paleta permite al artista untar y mezclar pinturas de diferentes colores. SpaceFusion se compromete a ayudar a los científicos de IA a hacer cosas similares para diferentes modelos entrenados en diferentes conjuntos de datos.

Para los modelos modernos de aprendizaje profundo, los conjuntos de datos generalmente están representados por vectores en diferentes espacios ocultos utilizando diferentes redes neuronales. En el artículo " Optimización conjunta de la diversidad y la relevancia en la generación de reacciones neuronales ", mis coautores y yo presentamos SpaceFusion, un paradigma de entrenamiento que puede "mezclar" varios espacios ocultos, como pinturas en una paleta, para que la IA pueda usar los patrones y el conocimiento integrados en cada uno de ellos. ellos. La implementación de este trabajo está disponible en GitHub .

Captura el color de la conversación humana.


Como primer intento, aplicamos esta técnica a la IA neural interactiva. En nuestra configuración, se espera que el modelo neuronal genere respuestas relevantes e interesantes basadas en el historial o contexto de la conversación. A pesar de que se han logrado éxitos prometedores en los modelos de comunicación neuronal, estos modelos, por regla general, intentan no correr riesgos, reproduciendo respuestas generales y aburridas. Se han desarrollado enfoques para diversificar estas respuestas y reflejar mejor el color de la conversación humana, pero a menudo surge un compromiso con una disminución en la relevancia. .


Figura 1: al igual que una paleta que facilita la combinación de pinturas, SpaceFusion alinea o mezcla espacios ocultos de los modelos seq2seq (S2S, puntos rojos) y autoencoder (AE, puntos azules) para compartir los dos modelos de manera más eficiente.

SpaceFusion resuelve este problema al vincular espacios ocultos extraídos de dos modelos (Figura 1):

  • el modelo de secuencia a secuencia (S2S), cuyo objetivo es obtener respuestas relevantes, pero puede tener pocas diferencias; también
  • Un modelo de autoencoder (AE) que es capaz de presentar diferentes respuestas pero no refleja su relación con la conversación.

Un modelo co-entrenado puede aprovechar las fortalezas de ambos modelos y organizar los puntos de datos de una manera más estructurada.


Figura 2: lo anterior muestra un contexto y sus muchas respuestas en el espacio oculto causadas por SpaceFusion. La distancia y la dirección del vector de respuesta pronosticado, teniendo en cuenta el contexto, corresponden aproximadamente a la importancia y la diversidad, respectivamente.

Por ejemplo, como se muestra en la Figura 2, teniendo en cuenta el contexto, en este caso, "¿Alguien quiere comenzar este juego?" - las respuestas positivas "Me gustaría jugarlo" y "Sí, juego" se encuentran en una dirección. Los negativos - "No estoy interesado en el juego" y "No, no estoy interesado" - se asignan en una dirección diferente. La diversidad en las respuestas se logra a través del estudio del espacio oculto en diferentes direcciones. Además, la distancia en el espacio oculto es relevante. Las respuestas más alejadas del contexto: "Sí, juego" y "No, no juego", generalmente son de naturaleza general, mientras que los que están más cerca son más relevantes para el contexto específico: "No estoy interesado en el juego" y "Cuándo vas a jugar?

SpaceFusion separa los criterios de relevancia y diversidad y los presenta en dos dimensiones independientes: dirección y distancia, lo que facilita la optimización conjunta de ambos. Nuestros experimentos empíricos y evaluaciones en humanos han demostrado que SpaceFusion funciona mejor en estos dos criterios en comparación con las líneas de base competitivas.

Aprendizaje de espacio oculto compartido


Entonces, ¿cómo exactamente SpaceFusion asigna diferentes espacios ocultos?

La idea es bastante intuitiva: para cada par de puntos de dos espacios ocultos diferentes, primero minimizamos su distancia en el espacio oculto común y luego mantenemos una transición suave entre ellos. Esto se hace agregando dos nuevos términos de regularización - término de distancia y término de suavidad - a la función objetivo.

Tomando la conversación como ejemplo, el término distancia mide la distancia euclidiana entre el punto desde el espacio oculto S2S, que se muestra en función del contexto y representa la respuesta pronosticada, y los puntos desde el espacio oculto AE que corresponden a sus respuestas objetivo. Minimizar esta distancia alienta al modelo S2S a mostrar el contexto como un punto cercano y rodeado por sus respuestas en un espacio oculto común, como se muestra en la Figura 2.

El término suavidad mide la probabilidad de generar una respuesta objetivo a partir de la interpolación aleatoria entre un punto mapeado de un contexto y un punto mapeado de una respuesta. Al maximizar esta probabilidad, alentamos una transición suave en el valor de las respuestas generadas a medida que se aleja del contexto. Esto nos permite explorar la vecindad del punto de pronóstico hecho por S2S, y así generar una variedad de respuestas que son relevantes para el contexto.

Con estas dos nuevas regularizaciones agregadas a la función objetivo, imponemos restricciones de distancia y uniformidad en el aprendizaje de espacios ocultos, por lo que la capacitación no solo se centrará en el rendimiento en cada espacio oculto, sino que también intentará alinearlos agregando estas estructuras deseadas. Nuestro trabajo se ha centrado en modelos interactivos, pero esperamos que SpaceFusion alinee los espacios ocultos entrenados por otros modelos en diferentes conjuntos de datos. Esto conectará las diversas habilidades y áreas de conocimiento aprendidas por cada sistema de IA en particular, y es el primer paso hacia una IA más integral.


Ver también: 7 cursos gratuitos para desarrolladores

Source: https://habr.com/ru/post/474244/


All Articles