Redes neuronales en citas

Los conocidos o las citas son eternos, siempre existirán en varias formas: en la calle, en Internet, en sitios o dentro de aplicaciones móviles. Las personas siempre tendrán el deseo de conocer a alguien y todos elegirán la forma más conveniente para ellos. Algunos continúan familiarizándose en bares, cafeterías, en la calle, otros usan tecnologías modernas y se familiarizan en línea. Cada uno tiene su propia elección y no juzgaremos a ninguna de las partes, pero la discusión adicional será sobre las citas en línea.

imagen

Ejemplos de aplicaciones de citas

Si no toca una gran cantidad de fraudes, delincuentes, spammers en este segmento, en realidad en los sitios o en las aplicaciones móviles las personas buscan una pareja y es deseable que su interés mutuo sea mutuo. Todo lo que no cumple con este criterio, de hecho, es una pérdida de tiempo por un lado. El enfoque mejor establecido desde el punto de vista de la presentación de información es "folletos", donde se muestra un perfil y el espectador debe decidir si le gusta o no (me gusta, no me gusta). Si le gusta el cuestionario, se le notificará y, si existe un interés mutuo, entonces es posible comenzar un diálogo. Las desviaciones de este esquema son posibles en diversas aplicaciones y en diferentes sitios, pero el principio general de funcionamiento debe ser claro.

Me gusta, presentado hace muchos años por Facebook, resultó ser una herramienta poderosa y conveniente muy poderosa. Permite sin diálogo mostrar su interés en alguien y, dependiendo de su reacción, no esperar una respuesta, sino continuar buscando. Si hay una reacción, puede comenzar un diálogo, pero su valor es mucho mayor que simplemente "saludos" dispersos sin tener en cuenta la reciprocidad.

Sí, los "me gusta" ayudaron y el uso de la simpatía mutua también, pero, sin embargo, en el mercado de citas, poco ha cambiado en los últimos 15 años, y esto es extraño para la industria de TI, en la que también se están desarrollando las citas en línea.

¿Cuál es, de hecho, el problema?


En promedio, según las estadísticas, 17 me gusta por cada 100 no me gusta. Es decir, una persona hace mucho más trabajo inútil que útil y recibe contenido que no le interesa. Esto tiene en cuenta los parámetros de filtrado actuales de los resultados (búsqueda por ciudad, edad, intereses y otras características especificadas en el perfil). Resulta que la acción principal de la persona en relación con el cuestionario no está relacionada con el conocimiento de la información de texto que el propietario del cuestionario completó sobre sí mismo, sino que está relacionada exclusivamente con la percepción de la fotografía presentada (del todo o de la persona, en particular). Ya se realizará una evaluación adicional del oponente en el siguiente paso, cuando se forme una simpatía mutua.

imagen
Me gusta, no me gusta: ¿cuál es el problema?

El objetivo final es reducir el número de acciones inútiles de los usuarios y hacer una selección de perfiles en una fecha de mejor calidad que en la etapa actual. Teniendo una base suficientemente grande para construir estadísticas, analizar y probar hipótesis, así como para entrenar y usar redes neuronales, hicimos y probamos los dos supuestos siguientes:

  1. Pero, ¿qué pasa si todas las personas son similares y al analizar los resultados de personas similares en la elección de los perfiles, puede mejorar e influir en la calidad de esta muestra?
  2. ¿Puede una red neuronal a partir de fotografías predecir nuestras preferencias en función de la experiencia previa?

imagen
Redes neuronales en citas

A continuación, describiremos con más detalle nuestros experimentos utilizando el ejemplo de datos de una de las aplicaciones móviles de la esfera de citas. Gracias a los colegas que dieron su consentimiento para tales experimentos, análisis y la introducción de nuevas tecnologías. Por supuesto, todos los cambios realizados y los experimentos realizados de ninguna manera violan la Ley Federal de datos personales y GDPR.

Solución 1. ¿Qué pasa si todas las personas son iguales?


La suposición y la hipótesis son las siguientes: si a una persona le gusta que alguien tenga en cuenta los filtros de búsqueda básicos, como la ciudad, el rango de edad y el género, entonces los resultados (elección) de otra persona a la que le gusta la misma persona serán más propensos a ajustarse al primero y tener en cuenta repitiendo hipótesis y aumentando el número de personas, mejorará la calidad de la muestra.

Una extensión de esta hipótesis es la minimización de los parámetros de filtrado entrantes por género y ciudad, además de tener en cuenta no solo los gustos salientes de las personas que está buscando con preferencias similares, sino también las respuestas a ellos de los perfiles que les gustan.

Prueba de hipótesis. Solo el género y la ciudad se especifican en el filtro. Resultados de muestreo con disgustos al principio:

  1. Los primeros cuatro perfiles que no les gustan
  2. Los dos primeros me gusta en perfiles adecuados
  3. Otra aversión
  4. Y en la cuarta iteración, se obtiene una muestra de 5 perfiles adecuados según los criterios especificados.

Basado en el experimento, se demuestra el proceso de generar automáticamente una consulta de búsqueda basada en las opiniones de otras personas, en función de las cuales se forman las posibles preferencias del participante activo.

Como una extensión de este esquema, es posible considerar eliminar los disgustos junto con los me gusta para aclarar el retrato de la persona, así como la edad y otras características de los perfiles que caen en la muestra.

Configuraciones de algoritmo utilizadas al probar una hipótesis:

imagen

Opción 2. Y aprendamos la red neuronal para tomar una decisión por nosotros.


El supuesto y la hipótesis son los siguientes: quizás la persona en la foto juega un papel más importante en la elección de las personas que el fondo general, la ubicación, los accesorios, la calidad de disparo y otros factores. Para probar la hipótesis, se utilizó un detector en Intel OpenVINO con 1 millón de fotos. Los resultados se obtuvieron de las caras de las fotos generales de los usuarios con una base de datos paralela de me gusta (a quién le gusta quién y dónde es mutuo) El resultado del detector y la imposición de puntos clave de la cara en la imagen original:

imagen

Además, en el proceso de aprendizaje, se transmitieron pares de fotografías en diversas variaciones a las redes neuronales en el proceso de entrenamiento:

  • La primera foto (perfil) como la segunda
  • La primera foto (perfil) como la segunda y la segunda primero
  • A la primera foto (perfil) no le gusta la segunda, y a la segunda no le gusta la primera.

A continuación se muestra la muestra de entrenamiento al comparar sobre la base de me gusta en la base de datos. Dos entradas en forma de fotos que se transmiten a la red solo si hay un me gusta entrante del primero al segundo, me gusta mutuo o cuando no hay me gusta mutuo (para tres redes diferentes con su entrenamiento secuencial).

El resultado fueron tres redes neuronales que, con un cierto grado de probabilidad, pueden determinar la compatibilidad de las personas en las fotografías. La ventaja de esta opción sobre la primera es la alta velocidad de búsqueda de preferencias en las fotografías y el número mínimo de consultas y dependencias a nivel de la consulta SQL. En otras palabras, la solución resultante es altamente productiva con alta velocidad y bajo consumo y requisitos de recursos en el proceso de inferencia (no debe confundirse con el proceso de aprendizaje, donde se requiere el máximo rendimiento de los sistemas informáticos y la participación de muchas GPU en el proceso).

Conclusiones


Hemos implementado ambas opciones y en la etapa actual estamos recopilando estadísticas sobre su efectividad. Es curioso que ambos esquemas resultaron estar funcionando y permitieron mejorar significativamente el resultado de la emisión, reduciendo el número de acciones inútiles por parte de los usuarios. El resultado final para el negocio es un aumento en la participación del usuario, un aumento en el número total de me gusta mutuos y, como resultado, el número de compras de cuentas pagas.

Ahora la fase de operación de prueba de ambas soluciones está en marcha y los algoritmos se proporcionan a los usuarios de forma selectiva, pero si desea probar la primera o segunda hipótesis usted mismo en una base real de perfiles, regístrese en la aplicación y póngase en contacto por correo electrónico dushin@combox.io, indique su inicio de sesión en la aplicación en la carta, dar acceso

Source: https://habr.com/ru/post/476406/


All Articles