Arthur Khachuyan: Inteligencia artificial en marketing

Arthur Khachuyan es un conocido especialista ruso en procesamiento de big data, fundador de Social Data Hub (ahora Tazeros Global). Socio HSE. Preparado y presentado junto con el Proyecto de Ley de Datos Superiores de la Escuela Superior de Economía en el Consejo de la Federación, habló en el Instituto Curie en París, la Universidad Estatal de San Petersburgo, la Universidad Federal bajo el Gobierno de la Federación de Rusia, en Red Apple, International OpenDataDay, RIW 2016, Alfa Future People.

La conferencia se grabó en el festival al aire libre "Geek picnic" en Moscú en 2019.



Arthur Khachuyan (en adelante, AH): - Si proviene de una gran cantidad de industrias: desde la medicina, la construcción, desde algo, para elegir algo, donde la tecnología de big data, aprendizaje automático, aprendizaje profundo se usa con mayor frecuencia, entonces esto es probablemente comercialización Debido a los últimos tres años, todo lo que nos rodea en algún tipo de comunicación publicitaria ahora está vinculado específicamente al análisis de datos y precisamente a lo que se puede llamar inteligencia artificial. Por lo tanto, hoy les contaré de una historia tan lejana ...

Si imagina la inteligencia artificial, cómo se ve, probablemente esto sea algo. La extraña imagen es una de las redes neuronales que escribí hace un año para encontrar la dependencia de lo que hace mi perro: cuántas veces necesita ir grande, pequeña y cómo generalmente depende de cuánto come o no . Esta es una broma sobre cómo se puede imaginar la inteligencia artificial.



Pero aún así, pensemos en cómo funciona todo en las comunicaciones publicitarias. Hay tres áreas de cómo los algoritmos modernos en publicidad y marketing pueden interactuar con nosotros. Está claro que la primera historia tiene como objetivo obtener y extraer conocimiento adicional sobre nosotros y luego usarlos para algunos propósitos buenos y no muy buenos; personalizar el enfoque de cada persona específica; Naturalmente, después de eso, para formar una cierta demanda con el fin de completar la acción objetivo principal y realizar una determinada venta.

Utilizando la tecnología, intentan resolver el problema de la comunicación efectiva.


Si te digo que pienses qué es común entre Pornhub y M. Video ", ¿qué piensas?

Comentarios de la audiencia (en adelante - H): - Teleki, audiencia.

AH: Mi concepto es que estos son dos lugares donde las personas vienen para un cierto tipo de servicio, o llamémoslo, para un cierto tipo de bienes. Y esta audiencia es diferente en el sentido de que no quiere decirle nada al vendedor. Ella quiere entrar y obtener lo que le interesa en alguna forma explícita o implícita. Naturalmente, nadie viene a "M. Video ", no quiere comunicarse con ningún vendedor, no quiere entender, no quiere responder ninguna de sus preguntas.

Por lo tanto, la primera historia se desprende de todo esto.

Cuando apareció la tecnología de obtener conocimiento adicional para no comunicarse con una persona de alguna manera. A todos nos gusta cuando llamamos al banco, y el banco nos dice: “Hola. Alexey, eres nuestro cliente VIP. Algún supermanager te hablará ahora. Vienes a este banco y realmente hay un gerente único que puede hablar contigo. Desafortunadamente o afortunadamente, ni una sola compañía ha descubierto cómo contratar a mil gerentes personales para mil clientes; y dado que la mayoría de estas personas ahora están en línea, la tarea es comprender qué tipo de persona es y cómo comunicarse con él correctamente antes de recurrir a algún recurso publicitario. Y por lo tanto, de hecho, hay tecnologías que están tratando de resolver este problema.

La minería de datos es el nuevo petróleo


Imagina que eres el dueño de un puesto de flores. Tres personas vienen a ti. El primero permanece parado durante mucho tiempo, duda, trata de hablar contigo, toma algún tipo de ramo: lo dejas para envolverlo, sales a hacer algo allí; con este ramo se escapa del puesto: perdiste tus tres mil rublos. ¿Por qué sucedió esto? No sabe nada de esta persona: no conoce su historial de impulsos en el Ministerio del Interior, no sabe que es cleptómano, está registrado en un dispensario psiquiátrico. Por qué Porque lo viste por primera vez y no eres un especialista en análisis de comportamiento.

Algo más viene ... Vitaly. Vitaly también comprende mucho tiempo y dice: "Bueno, ahora necesito esto, aquello, aquello". Y le dices, - Flores para mamá, ¿verdad? Y le vendes un ramo.

El concepto aquí es encontrar suficientes datos para comprender lo que esta persona necesita. Todos pensaron de inmediato en algún tipo de redes publicitarias, etc.

¿Probablemente todos hayan escuchado la estúpida frase repetidamente que "los datos son petróleo nuevo"? Seguramente todos lo escucharon. De hecho, la gente aprendió a recopilar datos hace mucho tiempo, pero extraer datos de estos datos es la tarea que la inteligencia artificial ahora está tratando de resolver en marketing, o algún tipo de algoritmo estadístico. Por qué Porque si hablas con una persona, él puede darte la respuesta correcta, incorrecta o de alguna manera teñida. El chiste que les cuento a los estudiantes, cómo las encuestas difieren de las estadísticas, les contaré en forma de chiste:

Entonces, en dos pueblos decidieron realizar un estudio sobre la duración promedio de la dignidad masculina. Entonces, en el primer pueblo, Villaribo, la longitud promedio es de 15 centímetros, en el pueblo de Villabaggio - 25. ¿Sabes por qué? Porque en la primera aldea se tomaron medidas, y en la segunda, una encuesta.

Industria del porno: el buque insignia de los sistemas de recomendación


Esta es la razón por la cual el enfoque moderno de analizar a todas las personas sin excepción, incluso si son ligeramente inferiores al 100%, pero estas son personas a las que no es necesario preguntar, no es necesario observarlas. Es suficiente analizar lo que ahora se llama la huella digital para comprender lo que esta persona necesita, cómo hablarle correctamente, cómo formar adecuadamente la demanda a su alrededor. Por un lado, esta es una máquina sin sentido (pero todos lo sabemos muy bien); no queremos comunicarnos con personas de M. Video ", y aún más, al acceder a recursos como" Pornhub ", queremos obtener exactamente lo que necesitamos.

¿Por qué siempre estoy hablando de pornhub? Porque la industria adulta es la primera que vino al análisis de tecnologías similares, a la introducción de tecnologías similares, al análisis de datos. Si toma las tres bibliotecas más populares en esta área (por ejemplo, TensorFlow o Pandas para el "pequeño lanzador", para procesar csv-shek, etc.), si abre en el "Github", con un breve "google" todos estos nombres encontrará un par de personas quienes trabajaron o están trabajando actualmente en Pornhub, y los primeros en implementar exactamente los sistemas de recomendación. En general, esta historia es muy avanzada y muestra cuánto es esta audiencia, cuánto ha avanzado esta compañía.



Tres niveles de identificación.


Alrededor de la persona hay un gran conjunto de datos que se pueden identificar. Por lo general, lo divido formalmente en tres niveles, sumergiéndome más y más. Naturalmente, la empresa tiene sus propios datos.

Si, por ejemplo, estamos hablando de construir un sistema de recomendación, entonces el primer nivel son los datos que se encuentran cerca de la tienda (historial de compras, todo tipo de transacciones, cómo interactúa una persona con la interfaz).

Luego hay un nivel (relativamente el más grande): esto es lo que se llama código abierto. No piense que le insto a que analice las redes sociales, pero de hecho, lo que hay en las fuentes abiertas abre un gran conjunto de datos que puede contar sobre una persona para aprender.

Y la tercera parte importante es el entorno de esta persona misma. Sí, existe la opinión de que si una persona no está en las redes sociales, no hay datos sobre él (probablemente ya sepa que esto no es así), pero lo más importante, los datos que están en el perfil de la persona (o en alguna aplicación ) - esto es solo el 40% del conocimiento que se puede obtener al respecto. La información restante se obtiene de su entorno. La frase "dime quién es tu amigo y te diré quién eres" adquiere un nuevo significado en el siglo XXI, porque se puede obtener una gran cantidad de datos sobre esta persona.

Hablando más cerca de las comunicaciones publicitarias, la comunicación publicitaria no proviene de la publicidad, sino de algunos de sus amigos, conocidos o personas verificadas de alguna manera: esta es una característica muy interesante que utilizan muchos vendedores. Cuando algún tipo de aplicación de repente te da un código promocional gratuito, publicas sobre él y, por lo tanto, atraes a una nueva audiencia. De hecho, este código promocional para Yandex.Taxi condicional no se eligió en absoluto al azar, y para esto se analizó una gran cantidad de datos sobre su potencial para atraer una nueva audiencia e interactuar de alguna manera con él.



Incluso analizan el comportamiento de los héroes de la serie.


Te mostraré tres fotos, y me dices cuál es la diferencia entre ellas.

Este:



Este:



Y este:



¿Cuál es la diferencia entre ellos? Todo es simple aquí. Como en la mecánica cuántica, en este caso, esta creatividad fue formada por un observador. Es decir, la diferencia en la misma campaña publicitaria realizada por la misma marca al mismo tiempo, solo en la que vio esta creatividad. Personalmente, cuando voy al Amediateka, todavía muestran Khala Drogo. No sé qué piensa Amediateka de mis preferencias, pero de alguna manera sucede.

Lo que ahora se llama comunicaciones personalizadas es la historia más popular de atraer a una audiencia e interactuar adecuadamente con ella. Si en la primera etapa identificamos personas que utilizan nuestros propios datos de marca, datos de código abierto y, por ejemplo, los datos del entorno de esta persona, podemos analizarlo y comprender quién es, cómo hablarle correctamente y, lo más importante, en qué idioma habla con el.

Aquí la tecnología ha llegado tan lejos que los héroes de la serie que una persona está viendo están siendo analizados. Es decir, te gusta la serie: a ellos les gusta mirar, mirar, con quién interactuaste, para comprender qué persona es la adecuada para que interactúes con ella. Parece una tontería completa, pero por el interés de algunos de los recursos, pruébelo: diferentes personas ven una creatividad diferente (para interactuar con ella correctamente).

Ni un solo medio de comunicación moderno ni ningún recurso de video solo le muestra ninguna noticia. Vaya a los medios: se cargan una gran cantidad de algoritmos que lo identifican, comprenden toda su actividad anterior, hacen un llamamiento al modelo y luego le muestran algo. En este caso, aquí hay una historia tan extraña.

¿Cómo define sus necesidades? Psicometria Fisonomía


Hay muchos enfoques (reales) para determinar las necesidades reales de una persona y cómo comunicarse con ella correctamente. Hay muchos enfoques, todos deciden de diferentes maneras, uno no puede decir qué tan bueno, qué tan malo. Básico, al parecer, todos lo saben.



Psicometria Después de la historia con Cambridge Analytics, ella tomó un giro impactante, en mi opinión, porque cada segunda compañía política ahora viene y dice: “Oh, ¿puedes hacerlo conmigo como Trump? También quiero ganar, y así sucesivamente ". De hecho, esto, por supuesto, no tiene sentido para nuestras realidades, por ejemplo, elecciones políticas. Pero se utilizan tres modelos para determinar los psicotipos:

  • el primero se basa en el contenido que consume: en las palabras que escribe, en la información que le gusta, el video, etc.
  • el segundo está vinculado a cómo interactúa con la interfaz web, cómo escribe, qué botones mantiene presionada; de hecho, hay compañías enteras que pueden determinar de manera confiable lo que ahora se llama psicotipos utilizando la escritura a mano del teclado.
  • No soy psicólogo, no entiendo exactamente cómo funciona, pero desde el punto de vista de las comunicaciones publicitarias, las audiencias divididas en estos segmentos funcionan muy bien, porque alguien necesita mostrar una pantalla roja con una mujer azul, alguien necesita un oscuro es un fondo azul con algún tipo de abstracción, y funciona muy bien. En algunos niveles bajos, tanto que una persona ni siquiera piensa en ello. ¿Cuál es el principal problema en el mercado publicitario? Todos son agentes de los servicios especiales, todos se esconden, todos tienen un millón de permisos de navegación configurados para que no se identifiquen de ninguna manera; probablemente tenga Adblocks, Gostry y todo tipo de aplicaciones que bloquean el seguimiento. Debido a esto, es muy difícil entender algo sobre una persona. Y la tecnología ha ido más allá: no solo necesita saber que esta persona ha regresado a su sitio por 125ª vez, sino que sigue siendo una persona tan extraña.

La fisonomía es una ciencia muy controvertida. Ni siquiera se considera ciencia. Este es un grupo de personas que solían programar detectores de mentiras para algún Ministerio del Interior, y ahora se dedican, como dicen, a la personificación de la creatividad. El enfoque aquí es muy simple: tome algunas de sus fotos públicas de algunas redes sociales, utilizándolas para construir geometría tridimensional. Y si usted es abogado, ahora dirá que se trata de una persona y datos personales; y le diré que estos son 300 mil puntos ubicados en el espacio, y esto no es una persona, y no son datos personales. Eso es lo que todos suelen decir cuando Roskomnadzor se acerca a ellos.

Pero en serio, por separado, su cara, si su nombre y apellido no están firmados allí, no son sus datos personales. La conclusión es que los chicos marcan varias características faciales que afectan la forma en que una persona toma decisiones y cómo interactuar con él. En algún lugar funciona mal, en algunos segmentos de publicidad; en qué segmentos funciona muy bien. Al final, resulta que cuando vas a un determinado recurso, ves más de un banner que se muestra a todos, pero, por ejemplo ... ahora es normal hacer 16 o 20 opciones para diferentes audiencias, y funciona muy bien. Sí, esto es aún más triste desde el punto de vista del consumidor, porque las personas comienzan a manipular cada vez más. Sin embargo, desde el punto de vista comercial, esto funciona muy bien.

La caja negra del aprendizaje automático


Esto plantea el siguiente problema de tales tecnologías: después de todo, para la mayoría de los desarrolladores ahora lo que se llama aprendizaje profundo es una "caja negra". Si alguna vez te sumergiste en esta historia y hablaste con los desarrolladores, siempre dicen: "Oh, escucha, bueno, tenemos algo tan incomprensible allí, y no sabemos cómo funciona". Quizás alguien lo tenía.

Esto está realmente lejos de la verdad. Lo que ahora se llama aprendizaje automático está lejos de ser una caja negra. Hay una gran cantidad de enfoques para describir los datos de entrada y salida, y al final, la compañía puede comprender a fondo, sobre la base de las señales que la máquina decidió mostrarle este video pornográfico u otro. La pregunta es que ninguna de las compañías revela esto, porque: en primer lugar, un secreto comercial; en segundo lugar, habrá una gran cantidad de datos que ni siquiera conocías.

Por ejemplo, antes de esto, en una discusión sobre ética, discutimos cómo las redes sociales analizan los mensajes personales para etiquetar a las personas en algún tipo de historias publicitarias. Escribes algo a alguien; sobre esta base, obtienes una determinada etiqueta para, de hecho, algún tipo de comunicación publicitaria. Y nunca lo probarás, y probablemente no tenga sentido probarlo. Sin embargo, si tales modelos fueran revelados, lo serían. Resulta que el mercado para construir tales sistemas de recomendación pretende no saber por qué sucedió esto.

Las personas no quieren saber lo que saben de ellas.


Y la segunda historia es que el cliente nunca quiere saber por qué recibió este anuncio en particular, este producto en particular. Te contaré una historia así. Mi primera experiencia en la implementación comercial de sistemas de recomendación basados ​​en tales algoritmos fue por el bien de la investigación en 2015 en una red muy grande de tiendas de sexo (sí, esta tampoco es una historia muy hospitalaria).



A los clientes se les ofreció lo siguiente: inician sesión, inician sesión con su red social, en algún lugar en 5 segundos reciben una tienda totalmente personalizada para ellos, es decir, todos los productos han cambiado directamente, pertenecen a una determinada categoría, etc. ¿Sabes cuánto ha aumentado la conversión de esta tienda? ¡Para nada! La gente entró e inmediatamente se le acabó. Entraron y se dieron cuenta de que se les ofreció exactamente lo que estaban pensando ...

El problema con esta prueba fue que debajo de cada producto estaba escrito por qué te ofrecían exactamente eso ("porque estás en el grupo oculto" La mujer imperiosa está buscando un hombre - "trapo"). Por lo tanto, los sistemas modernos de recomendación nunca muestran los datos sobre la base de los cuales se realizó el "pronóstico".

Los medios son una historia muy popular porque todos usan sistemas de referencia similares. Anteriormente, los algoritmos eran muy simples: vea la categoría "Política": le mostrarán las noticias de la categoría "Política". Ahora todo es tan complicado que analizan los lugares donde detuvo el mouse, en qué palabras se concentró, qué copió, cómo interactuó con esta página. Luego analiza el vocabulario de los mensajes: sí, no solo estás leyendo las noticias sobre Putin, sino de cierta manera, con cierto color emocional. Y cuando una persona recibe algunas noticias, ni siquiera pensará en cómo llegó aquí. Sin embargo, luego interactúa con este contenido.

Todo esto, por supuesto, tiene como objetivo mantener a un hombre pobre y desafortunado que está tan loco por la gran cantidad de información que lo rodea. Debe decirse aquí que sería bueno usar tales sistemas para personificar la creatividad a su alrededor, recopilar información, pero, desafortunadamente, hasta el momento no existen tales servicios.

La inteligencia artificial atrapa al cliente en el despegue y forma la demanda


Y aquí surge una pregunta filosófica muy interesante, pasando de la creación de un sistema de recomendación a la formación de la demanda. Rara vez alguien lo piensa, pero cuando intentas preguntarle al Instagram condicional, “¿Por qué estás recopilando datos? ¿Por qué no mostrarme un anuncio absolutamente aleatorio? ”,“ Instagram ”te dirá:“ Amigo, todo está hecho para mostrarte exactamente lo que te interesa ”. Como, definitivamente queremos conocerte para mostrarte exactamente lo que estás buscando.



Pero la tecnología ha superado durante mucho tiempo este hito terrible, y tecnologías similares ya no predicen lo que necesita. Ellos (¡atención!) Forman la demanda. Esto es probablemente lo peor que gira en torno a la inteligencia artificial en tales comunicaciones. Es terrible, ya que se ha utilizado casi universalmente durante los últimos 3-5 años, desde la emisión de Google hasta la emisión de Yandex, hasta algunos sistemas ... De acuerdo, no diré nada malo sobre Yandex; y bueno

Cual es el punto? Tales comunicaciones publicitarias han pasado de la estrategia cuando escribes "Quiero comprar un asiento para niños" y ves cien mil millones de publicaciones. Continuaron con lo siguiente: solo una mujer publicó una foto con una barriga apenas visible, su esposo inmediatamente comenzó a buscar mensajes: “Hombre, pronto entrega. Compre un asiento para bebé ".

Aquí razonablemente se pregunta por qué, con avances tecnológicos tan gigantescos, todavía vemos anuncios tan malos en las redes sociales. El problema es que el dinero todavía resuelve todo en este mercado, por lo que en algún buen momento, algún anunciante como "Coca-Cola" puede venir y decir: "Aquí tienes 20 millones: muestra mis pancartas de mierda en Internet". Y realmente lo hacen.

Pero si hace algún tipo de cuenta limpia y prueba con qué precisión esos algoritmos lo adivinarán: primero intentan adivinarlo, y luego comienzan a hacer algo por adelantado. Y el cerebro humano funciona de tal manera que, al recibir información confiable para él, ni siquiera procesa el momento por el que recibió esta información. La primera regla es determinar que estás en un sueño: debes entender cómo llegaste aquí. Una persona nunca recuerda el momento en que estaba en una habitación. Es lo mismo aquí.

Google puede comenzar a dar forma a su visión del mundo


Dichos estudios fueron realizados por varias compañías extranjeras que se dedican al seguimiento ocular. Colocan dispositivos en computadoras especiales que registran dónde miran los ojos del sujeto. Ella tomó de cinco a siete mil voluntarios que simplemente desplazaban la cinta, interactuaban con las redes sociales, con publicidad, y escribían información sobre qué partes de pancartas y creativos dejaban de ver estas personas.

Y resultó que cuando las personas obtienen una creatividad tan superpersonalizada, ni siquiera piensan en ello; inmediatamente se van, comienzan a interactuar con ella. Desde el punto de vista de los negocios, esto es bueno, pero desde el punto de vista de nosotros, como usuarios, esto no es muy bueno, porque, ¿de qué tienen miedo? - Que en un buen momento el "Google" condicional puede comenzar (y, por supuesto, ni siquiera comenzar) a formar su propia cosmovisión. Puede que mañana, por ejemplo, comience a mostrar a la gente que la tierra es plana.

Es una broma, pero fueron atrapados una gran cantidad de veces que durante las elecciones comienzan a dar cierta información a ciertas personas. Todos estamos acostumbrados al hecho de que el motor de búsqueda lo entiende todo honestamente. Pero, como siempre digo, si realmente quieres saber cómo funciona el mundo, escribe tu propio motor de búsqueda, sin filtros, sin prestar atención a los derechos de autor, sin clasificar a ninguno de tus amigos en la lista. La emisión de datos reales en Internet es generalmente diferente de lo que muestran Google, Yandex, Bing, etc. Algunos materiales se esconden, porque amigos, colegas, enemigos u otra persona (o un ex amante con quien te acostaste) no importa.

Cómo triunfo triunfo


Cuando se celebraron las últimas elecciones en los Estados Unidos, se realizó un estudio muy simple. Tomaron las mismas solicitudes en diferentes lugares, de diferentes IP, de diferentes ciudades, diferentes personas buscaron en Google lo mismo. Convencionalmente, la solicitud tenía el estilo de: ¿quién ganará las elecciones? Y, sorprendentemente, los resultados se construyeron de tal manera que en aquellos estados donde el mayor número de personas intentó votar por el candidato equivocado, recibieron buenas noticias sobre el candidato promovido por Google. Cual? Bueno, está claro qué: el que se convirtió en presidente. Esta es una historia absolutamente imposible de probar, y todos estos estudios, con el dedo sobre el agua. Google puede decir: "Chicos, todo esto se hace para que podamos mostrarles el contenido más relevante".

De ahora en adelante, debes saber que lo que se llama el más relevante no es un higo. La compañía considera relevante lo que necesita vender por algunas buenas o malas razones.

Los que no tienen dinero ahora ya se están preparando para futuras compras


Todavía hay un momento tan interesante, del que hablaré. Una gran cantidad de audiencias activas se encuentran ahora en las redes sociales, en las aplicaciones: se trata de jóvenes. Lo llamaremos así: jóvenes insolventes: niños de 8-9 años que hacen clic en juegos tontos, estos son 13-12-14 que solo se registran en las redes sociales. ¿Por qué las grandes empresas gastarían enormes presupuestos y recursos para crear aplicaciones para audiencias insolventes que nunca se monetizan? En el momento en que esta audiencia se vuelva solvente, habrá suficientes datos para predecir su comportamiento muy bien.



Ahora pregunte a cualquier targetólogo cuál es la audiencia más difícil. Dirán: altamente rentable. Porque vender, por ejemplo, un departamento por valor de 150 millones de rublos a través de las redes sociales es casi imposible. Casos aislados cuando hace algún tipo de publicidad para 10 mil personas, uno compra este departamento: el cliente tiene éxito ... Pero uno de cada diez mil desde el punto de vista de las estadísticas es una mierda total. Entonces, ¿por qué es difícil identificar una audiencia altamente rentable? Debido a que las personas que ahora son miembros de una audiencia altamente rentable nacieron cuando Internet todavía era muy pequeño, cuando Artemy Lebedev aún no lo sabía, y no hay información sobre ellos. Es imposible predecir su modelo de comportamiento, es imposible entender quién piensan los líderes por ellos, de qué fuentes de contenido aceptan.

Por lo tanto, cuando se conviertan en multimillonarios en 25 años, y las compañías que le van a vender algo tengan una gran cantidad de datos. Por lo tanto, ahora ha aparecido un GDPR notable en Europa, que impide la recopilación de datos de menores.

Naturalmente, este higo no funciona en la práctica, ya que todos los niños todavía juegan a las cuentas de la madre y del padre, de esta manera se recopila la información. La próxima vez que le dé una tableta a su hijo, piénselo.

Absolutamente no un futuro terrible y antiutópico, cuando todos mueren en la guerra con las máquinas, una historia absolutamente real ahora. Hay una gran cantidad de empresas que crean algoritmos para las personas con perfil psicológico por la forma en que juegan. Muy interesante la industria. En base a esto, las personas se segmentan para poder comunicarse de alguna manera con ellas.



La predicción del comportamiento de estas personas estará disponible en 10-15 años, exactamente en el momento en que se conviertan en una audiencia solvente. Lo que es más importante, estas personas ya han dado permiso por adelantado para procesar sus datos personales, transferirlos a terceros y todo esto es felicidad, etc.

¿Quién perderá un trabajo?


Y la última historia que tengo es que todos siempre preguntan qué pasará dentro de 50 años: todos moriremos, habrá desempleo de los vendedores ... ¿Hay vendedores preocupados por el desempleo, verdad? Preocuparse, en general, no vale la pena, porque cualquier persona altamente calificada no perderá su trabajo.



Independientemente de los algoritmos que se creen, no importa cuánto llegue el automóvil a lo que tenemos aquí (señala la cabeza), si se desarrolla lo suficientemente rápido, esas personas nunca estarán inactivas, porque alguien tendrá que usar estas creatividades para hacer Sí, hay todo tipo de "ghans" que dibujan imágenes que parecen personas, crean música, pero aún así, es poco probable que algún día la gente pierda su trabajo en esta área.



Tengo todo con historia, así que puedes hacer preguntas si tienes más. Gracias



Presentador: - Amigos, ahora pasamos al bloque de preguntas y respuestas. Levantas la mano. Vengo a ti.



Pregunta de la audiencia (H): - Pregunta sobre la "caja negra". Dijeron que puede comprender específicamente por qué precisamente ese resultado para ese usuario. ¿Se trata de algún tipo de algoritmo, o cada vez que se necesita analizar cada modelo ad hoc (nota del autor: "especialmente para esto" - unidad fraseológica latina)? ¿O hay ya listas, para alguna red neuronal, puede comprender, en términos generales, el significado comercial?

AH:- Aquí debe comprender lo siguiente: en el aprendizaje automático hay una gran cantidad de tareas. Por ejemplo, hay una tarea: regresión. Para la regresión, no se necesitan redes neuronales en absoluto. Allí todo es simple: tiene varios indicadores, necesita calcular lo siguiente. Hay tareas en las que es necesario recurrir al aprendizaje profundo. De hecho, en el aprendizaje profundo es difícil comprender de manera confiable qué pesos se establecieron para qué neuronas, pero legalmente todo lo que necesita hacer es comprender qué datos estaban en la entrada, cómo se reproducían en la salida. Esto es lo suficientemente legal como para patentar tal decisión y es suficiente para entender sobre la base de la cual se adoptó la historia.

No existe tal cosa que fue al sitio y se le mostró algún tipo de banner porque lo fotografió con Instagram hace dos meses con el pelo rojo. Si el desarrollador no establece la recopilación de estos datos, la marca del color del cabello en este modelo, entonces no se tomará del techo.

¿Cómo vender los resultados de los sistemas de aprendizaje automático?


Z: - Solo la pregunta es: es entender cómo explicar, vender a alguien que no entiende el aprendizaje automático. Quiero decir: mi modelo: desde el color del cabello claramente conduce a ... bueno, el color del cabello cambia ... ¿Es esto posible o no?



AH: - Quizás sí. Pero desde el punto de vista de las ventas, el único esquema funcionará: tiene una campaña publicitaria, reemplazamos la audiencia con la que forma la máquina, y solo mira el resultado. Desafortunadamente, esta es la única opción confiable del cliente para convencer de que tal historia funciona, porque hay muchas soluciones en el mercado que alguna vez se implementaron y no funcionaron.

Acerca de crear una identidad virtual


Z: Hola. Gracias por la conferencia. La pregunta es: ¿cuál es la oportunidad para una persona que, por alguna razón, no quiere seguir el aprendizaje automático, crear una personalidad virtual que sea fundamentalmente diferente de su propia personalidad, a través de la interacción con la interfaz o por alguna otra razón?



AH: - Hay un montón de complementos diferentes que se ocupan específicamente de la aleatorización del comportamiento. Hay algo genial: Ghostery, que, en mi opinión, te oculta casi por completo de un montón de rastreadores diferentes que no pueden grabar esta información. Pero, de hecho, ahora un perfil cerrado en las redes sociales será suficiente para que nadie, ningún malvado analizador recolecte nada allí. Probablemente sea mejor poner algún tipo de extensión o escribir algo usted mismo.

Verá, aquí hay un concepto tal que legalmente, por ejemplo, los datos personales se refieren a datos por los cuales puede ser identificado, y la ley da como ejemplo la dirección del lugar de residencia, la edad, etc. Ahora los datos por los cuales puede identificarse son innumerables: la misma letra del teclado, la misma prensa, la firma digital del navegador ... Tarde o temprano, la persona se equivoca. Puede sentarse en algún lugar del "café" a través del "Tor", pero al final en algún momento olvidará encender la VPN o algo más, y en ese momento puede ser identificado. Entonces, la forma más fácil es crear una cuenta cerrada e instalar algún tipo de extensión.

El mercado se está moviendo hacia el hecho de que solo necesita presionar un botón para obtener el resultado


Z: Gracias por la historia. Como siempre, siempre es interesante (te sigo). La pregunta es: ¿cuál es el progreso en términos de crear sistemas de recomendación de sistemas fáciles de usar? Dijiste que alguna vez estuviste involucrado en sistemas de recomendación para encontrar una pareja sexual, amiga de la vida (o música que a una persona podría gustarle potencialmente) ... ¿Qué tan prometedor es todo esto y cómo ves su desarrollo precisamente desde el punto de vista de crear los sistemas que la gente necesita?

AH:- En general, el mercado se está moviendo hacia el hecho de que las personas necesitan presionar un botón e inmediatamente obtener lo que necesitan. En cuanto a mi experiencia en la creación de aplicaciones de citas (nosotros, por cierto, la reiniciaremos al final del año), allí, además del hecho de que el 65% eran hombres casados, el problema de recomendación más difícil fue que se le ofrecieron varios modelos a la persona al comienzo de la aplicación: " Amistad "," Sexo "," Amistad sexual "y" Negocios ". La gente no eligió lo que necesitaban. Los hombres vinieron a elegir "Amor", pero de hecho arrojaron un desnudo a todos, y así sucesivamente.

El problema era identificar a una persona que no se ajustaba a ninguno de estos modelos, y de alguna manera llevarla y moverla suavemente hacia el otro lado. Debido a la pequeña cantidad de datos, es muy difícil determinar si se trata de un error de algoritmo de pronóstico o si una persona no está en su categoría. Lo mismo ocurre con la música: hay muy pocos algoritmos realmente dignos que sean buenos para componer música. Quizás Yandex. Música. Alguien considera que el algoritmo Yandex.Music es malo. Por ejemplo, me gusta ella. Por ejemplo, personalmente no me gusta el algoritmo de música de YouTube, etc.

Existen, por supuesto, sus sutilezas: todo está relacionado con las licencias ... Pero realmente la demanda de tales sistemas es bastante grande. La compañía Retail Rocket, que se dedicaba a la implementación de sistemas de recomendación, se conoció en un momento, ahora de alguna manera no vive muy bien, aparentemente porque no desarrollaron sus propios algoritmos durante mucho tiempo. Todo va a esto: que entramos y, sin presionar nada, obtenemos lo que necesitamos (y completamente tonto, porque la capacidad de elegir ha desaparecido por completo de nosotros).

Comercialización de influenza


Z: Hola. Me llamo Konstantin Me gustaría plantear una pregunta sobre el marketing de influencia. ¿Conoces algún sistema que permita a una empresa elegir un blogger adecuado para una empresa basado en algunas estadísticas, etc.? ¿Y por qué motivo se hace esto?



AH: Sí, comenzaré desde lejos e inmediatamente diré que el problema con todas estas tecnologías es que toda esta inteligencia artificial en marketing se está moviendo como un equilibrista: hay grandes empresas a la izquierda que tienen mucho dinero, y de todos modos tendrán todo funciona de manera eficiente, porque sus campañas publicitarias están simplemente orientadas a la visualización; Por otro lado, hay un montón de pequeñas empresas para las que no funcionará, porque tienen muchos datos. Hasta ahora, la aplicabilidad de estas historias está en algún punto intermedio.

Cuando ya hay buenos presupuestos, y la tarea es procesar estos presupuestos correctamente (y, en principio, ya hay muchos datos) ... Conozco un par de servicios, algo como "Getblogger", que parecen tener algoritmos. Sinceramente, no he estudiado estos algoritmos. Puedo decirle qué enfoque usamos para buscar líderes de opinión cuando algunas madres necesitan dar un regalo.

Utilizamos una métrica llamada Content Distribution Time. Funciona de la siguiente manera: toma a la persona cuya audiencia está analizando, y necesita recopilar sistemáticamente (por ejemplo, cada 5 minutos) información sobre quién lo publicó, lo comentó, etc. Por lo tanto, será posible comprender en qué momento cada persona de su audiencia interactuó con su contenido. Repita esta operación para cada representante de su audiencia y, por lo tanto, utilizando la métrica del tiempo de distribución promedio del contenido, puede, por ejemplo, aparecer en color en un gran gráfico de red de estas personas y usar esta métrica para construir clústeres.

Esto funciona bastante bien si queremos, por ejemplo, encontrar 15 madres que tengan su opinión pública sobre alguna mujer. Pero esta es una implementación técnica bastante complicada (aunque en teoría es puramente posible hacer esto también en Python). La conclusión es que el problema del marketing de influencia en las grandes agencias de publicidad es que necesitan bloggers grandes, geniales y caros que no trabajen nada. Bueno, la marca de automóviles quiere vender algún producto a través de algún tipo de líder de opinión: necesitan usar el blogger de automóviles en último lugar, porque la audiencia de los que ya compraron un automóvil, o saben con certeza qué automóvil quiere, solo se ve en autos geniales. Aquí es importante no perderse el análisis de la audiencia de la persona misma.

Bots de marketing


Z: - Dime, ¿cuán fuertemente afectan los bots en las redes sociales a la recopilación de información y su calidad?



AH: - Con los bots algo tan interesante. Los bots baratos son fáciles de identificar: tienen el mismo contenido o son amigos entre sí o están en una sola cuadrícula. Con bots complejos también hay enfoques. ¿O le preguntas a una tarea cómo vincular a una persona con su falso?

Z: - ¿Cuánta información de calidad se generará con toda esta basura?

AH: - Aquí funciona de esta manera: debido al hecho de que hay una gran cantidad de datos (por ejemplo, para algún tipo de investigación de mercado), simplemente puede descartar todo este shusher. Es decir, es mejor lanzar un poco más de personas reales que capturar bots, porque es inútil que muestren todo tipo de anuncios. Pero si recopila métricas, por ejemplo, interacciones con pancartas o sistemas de recomendación, tales cuentas pueden ser desechadas.

Actualmente, hay seis personajes virtuales en las redes sociales o simplemente páginas abandonadas o introvertidas, que los algoritmos "coinciden" como los bots. En cuanto a vincular a una persona con su falso, todo aquí también está relacionado con el hecho de que una persona cometerá un error tarde o temprano, y la cuestión es que el modelo de comportamiento es el mismo: el de su cuenta real, el de su falso. Tarde o temprano, verán el mismo contenido o algo más.

Todo se reduce no al porcentaje de error, sino al tiempo necesario para la identificación confiable de una persona. Para alguien que vive con su Instagram, este tiempo de identificación confiable se reduce a cinco minutos. Para alguien, de seis a ocho meses.

¿A quién y cómo vender datos?


Z: Hola. ¿Me interesa saber cómo se venden los datos entre empresas? Por ejemplo, tengo una aplicación en la que puede averiguar (para el desarrollador) a dónde va una persona, qué tiendas almacena y cuánto dinero gasta allí. ¿Y estoy interesado en saber cómo, digamos, vender la información de estas tiendas sobre su audiencia a estas tiendas o arrojar sus datos en una gran base de datos y cobrar por ello?



AH: - En cuanto a la venta de datos directamente a alguien, usted, todo lo demás, fue superado por la OFD - operadores de datos fiscales, que se han incorporado hábilmente entre la transferencia de cheques y el Impuesto y ahora están tratando de vender todo a todos. De hecho, de hecho, han colapsado todo el mercado de la analítica móvil. De hecho, puede incrustar su aplicación, por ejemplo, un píxel de Facebook, su sistema DMP; luego use esta audiencia para vender. Por ejemplo, el píxel "May Target". No solo sé qué tipo de audiencia tienes, tienes que entender. Pero, en cualquier caso, puede integrarse en Yandex o My Target, que son los sistemas DMP más grandes.

Esta es una historia bastante interesante. El único problema es que les das todo el tráfico, y ellos se hacen cargo de la monetización de este tráfico como intercambios. Es posible que le digan que 10 personas usaron su audiencia, o que no. Por lo tanto, usted construye su red publicitaria o se rinde a un DMP grande.

¿Quién ganará, un artista o un técnico?


Z: - Una pregunta un poco alejada de la parte técnica. Se dijo sobre los temores de los vendedores sobre el inminente desempleo masivo. ¿Existe algún tipo de competencia entre el marketing creativo (estos tipos que crearon anuncios de pollo, los anuncios de Volkswagen parecen ser) y los que tratan con Big Date (que dicen: simplemente recopilaremos todos los datos y entregaremos anuncios dirigidos a todos )? Como una persona que está directamente involucrada, ¿cuál es su opinión, quién ganará, un artista, un técnico o será algún tipo de efecto sinérgico?



AH: - Escucha, bueno, trabajan juntos. Los ingenieros no inventan la creatividad. Aquellos que son creativos no tienen una audiencia. Hay una cierta historia multidisciplinaria. En realidad, aquellos que están sentados y presionan botones ahora tienen problemas, aquellos que hacen "señuelos" presionan lo mismo todos los días: esas personas desaparecerán.

Pero aquellos que analizan los datos permanecerán naturalmente, pero alguien tiene que procesar estos datos. Alguien tendrá que crear estas imágenes, dibujarlas. ¡Tal máquina creativa no se le ocurrirá! ¡Esto es una locura total! O como, por ejemplo, la publicidad viral Carprice, que, por cierto, funcionó muy bien. Recuerde, esto fue en YouTube: "Vender en Carprais", ella está absolutamente loca. Por supuesto, ninguna red neuronal generará tal historia.
En general, apoyo el hecho de que no las personas perderán sus trabajos, pero tendrán un poco más de tiempo libre y podrán dedicar este tiempo libre a la autoeducación.

La publicidad primitiva morirá


Z: - En general, los anuncios que se muestran, pancartas, en el mismo lugar, incluso los textos de venta no están escritos allí: "¡Necesitamos ventanas, tómalo!", "¡Necesitas algo más, tómalo!", Es decir, no hay creatividad en absoluto .

AH: - Tal publicidad morirá, por supuesto, tarde o temprano. Morirá no tanto por el desarrollo de la tecnología, sino cuánto por el desarrollo de usted y de mí.

Lo relevante se mezcla mejor con lo irrelevante


Z: - Estoy aquí! Tengo una pregunta sobre un experimento que, como usted dijo, no tuvo éxito (con un sistema de recomendación). Y en su opinión, el problema es que se firmó allí, ¿por qué se recomienda o que todo lo que el usuario vio era relevante para él? Debido a que leí un experimento para madres, y no había tantos datos allí y no había tantos datos de Internet, solo había datos de un minorista de alimentos: el embarazo previsto (que serían madres). Y cuando mostraron una selección de productos para mujeres embarazadas, las madres se horrorizaron de haber aprendido sobre ellas antes de algunas cosas oficiales. Y no funcionó. Y para resolver este problema, deliberadamente mezclaron bienes relevantes con algo completamente irrelevante.



AH: - Mostramos específicamente a las personas sobre la base de las recomendaciones que se hicieron para comprender sus comentarios. En realidad, a partir de aquí nació el concepto de que las personas no necesitan decir que se trata de algún tipo de bienes súper relevantes para él.

Sí, por cierto, hay un enfoque para mezclarlos con otros irrelevantes. Pero existe lo contrario: a veces las personas entran e interactúan con este producto irrelevante: se obtienen emisiones aleatorias, los modelos se descomponen y todo es aún más complicado. Pero realmente lo es. Además, muchas empresas específicamente, si saben que alguien está procesando sus datos (alguien puede robarles ese resultado), lo mezclan especialmente a veces para demostrar más tarde que no tomó los datos de su sistema de recomendación, pero del Yandex.Market condicional.

Bloqueadores de anuncios y seguridad del navegador


Z: Hola. Mencionaste Ghostery y Adblock. ¿Me puede decir cómo estos rastreadores son generalmente efectivos (tal vez de acuerdo con las estadísticas)? ¿Y tenía alguna orden de las empresas? Dicen, asegúrese de que Adblock no pueda cerrar nuestros anuncios.

AH: - No contactamos directamente con plataformas publicitarias, solo porque no pidieron asegurarse de que todos vieran sus anuncios. Yo personalmente uso Ghostery, creo que es una extensión muy buena. Ahora todos los navegadores están luchando por la privacidad: Mozilla ha lanzado un montón de todo tipo de actualizaciones, Google Chrome ahora es de super seguridad. Todos bloquean todo lo que es posible. Safari ya ha deshabilitado el giroscopio de forma predeterminada.
Y esta tendencia, por supuesto, es buena (no para aquellos que recopilan datos, aunque también salieron de ella), porque las personas primero bloquearon las cookies. Todos los propietarios de redes publicitarias recordaron una tecnología tan maravillosa como las huellas digitales del navegador: estos son algoritmos que reciben 60 parámetros diferentes (resolución de pantalla, versión, fuentes instaladas) y calculan un "identificador" único basado en ellos. Cambiamos a esto. Y los navegadores comenzaron a luchar con esto. En general, será una batalla interminable de titanes.

El último desarrollo "Mozilla" está bastante protegido. Ella prácticamente no guarda ninguna cookie, establece un tiempo de vida corto. Especialmente si enciendes Incognito, nadie te encontrará en absoluto. La pregunta es que será inconveniente ingresar contraseñas en todos los servicios.

¿Dónde funciona y no funciona el psicotipado y la fisionomía?


Z: Arthur, muchas gracias por la conferencia. También con mucho gusto sigo sus conferencias en "YouTube". Usted mencionó que los especialistas en marketing recurren cada vez más al uso de psicotipaje, fisonomía. Mi pregunta es: ¿en qué categorías de marcas funciona? Creo que solo es adecuado para FMCG. Por ejemplo, elegir un auto es ...

AH: - Puedo descargar donde funciona exactamente. Funciona en todo tipo de historias como Amediateki, programas de televisión, películas, etc. Esto funciona bien en bancos y productos bancarios, si este no es un segmento premium, sino todo tipo de tarjetas de estudiante, cuotas, estas son las cosas. Realmente funciona muy bien en FMCG y en todo tipo de "iPhones", cargadores, en todo este cheburd. Funciona bien en productos de "mamá", "padre". Aunque sé que en la pesca (hay un tema de este tipo) ... Varias veces hubo casos con pescadores: nunca se pueden segmentar de manera confiable. No se porque. Algún tipo de error estadístico.

Esto no funciona bien con los automovilistas, con las joyas, con algunas cosas para el hogar. De hecho, esto no funciona bien con algo sobre lo que las personas nunca habrían escrito en las redes sociales; puede verificarlo de esta manera. Condicionalmente, con la compra de una lavadora: ¿cómo entender quién tiene una lavadora y quién no? Parece que todos lo tienen. Puede usar los datos de CRF, para ver quién compró qué con cheques, para "recoger" a estas personas con cheques. Pero, de hecho, cosas de las que nunca habrías contado, por ejemplo, en Instagram, es difícil trabajar con esas cosas.

Las máquinas reconocen los trucos como lanzamientos estadísticos.


Z: Tengo una pregunta sobre la segmentación. ¿Es posible (o de repente existen) un personaje aleatorio condicional que se contradice en todo: al principio busca "los mejores gimnasios" y luego "10 formas de no hacer nada"? Y así en todo. ¿Puede la focalización seguir a una que se contradice a sí misma?

AH: - La única pregunta es: si usó Google durante 2 años, le contó todo lo que pudo sobre usted y ahora instaló un complemento que escribirá consultas aleatorias similares, entonces, por supuesto, según las estadísticas, puede entenderá: lo que está haciendo ahora es un valor atípico estadístico, y todo es eliminar. Si lo desea, registre una nueva cuenta, pero el volumen de publicidad no cambiará. Ella solo se volverá rara. Aunque ahora es extraña.


Un poco de publicidad :)


Gracias por quedarte con nosotros. ¿Te gustan nuestros artículos? ¿Quieres ver más materiales interesantes? Apóyenos haciendo un pedido o recomendando a sus amigos VPS basado en la nube para desarrolladores desde $ 4.99 , un análogo único de servidores de nivel básico que inventamos para usted: toda la verdad sobre VPS (KVM) E5-2697 v3 (6 núcleos) 10GB DDR4 480GB SSD 1Gbps desde $ 19 o cómo dividir el servidor? (las opciones están disponibles con RAID1 y RAID10, hasta 24 núcleos y hasta 40GB DDR4).

Dell R730xd 2 veces más barato en el centro de datos Equinix Tier IV en Amsterdam? ¡Solo tenemos 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV desde $ 199 en los Países Bajos! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - ¡desde $ 99! Lea sobre Cómo construir un edificio de infraestructura. clase utilizando servidores Dell R730xd E5-2650 v4 que cuestan 9,000 euros por un centavo?

Source: https://habr.com/ru/post/482816/


All Articles