Arthur Khachuyan: Inteligência Artificial em Marketing

Arthur Khachuyan é um conhecido especialista russo em processamento de big data, fundador do Social Data Hub (agora Tazeros Global). Parceiro de SMS. Preparou e apresentou em conjunto com a Escola Superior de Economia, o Bill de Dados Mais Elevados, no Conselho da Federação. Ele falou no Instituto Curie em Paris, Universidade Estadual de São Petersburgo, Universidade Federal sob o Governo da Federação Russa, na Red Apple, International OpenDataDay, RIW 2016, AlfaFuturePeople.

A palestra foi gravada no festival ao ar livre “Geek picnic” em Moscou em 2019.



Arthur Khachuyan (daqui em diante - AH): - Se de um grande número de indústrias - da medicina, da construção, de alguma coisa, para escolher alguma coisa, onde a tecnologia de big data, aprendizado de máquina e aprendizado profundo é mais usada, então provavelmente é marketing. Como nos últimos três anos, tudo o que nos rodeia em algum tipo de comunicação publicitária agora está ligado especificamente à análise de dados e precisamente ao que pode ser chamado de inteligência artificial. Portanto, hoje vou contar sobre uma história tão distante ...

Se você imagina inteligência artificial, como ela é - provavelmente isso é alguma coisa. A imagem estranha é uma das redes neurais que escrevi há um ano para descobrir a dependência do que meu cachorro faz - quantas vezes ele precisa ficar grande, pequeno e como geralmente depende de quanto ela come ou não . É uma piada sobre como a inteligência artificial pode ser imaginada.



Mas, ainda assim, vamos pensar em como tudo funciona nas comunicações publicitárias. Existem três áreas de como os algoritmos modernos de publicidade e marketing podem interagir conosco. É claro que a primeira história visa obter e extrair conhecimentos adicionais sobre nós e depois usá-los para alguns propósitos bons e não muito bons; personalizar a abordagem de cada pessoa específica; Naturalmente, depois disso, formar uma certa demanda para concluir a principal ação-alvo e realizar uma determinada venda.

Usando a tecnologia, eles estão tentando resolver o problema da comunicação eficaz.


Se eu disser para você pensar no que é comum entre Pornhub e M. Vídeo ", o que você vai pensar?

Comentários do público (a seguir - H): - Teleki, público.

AH: - Meu conceito é que esses são dois lugares onde as pessoas procuram um determinado tipo de serviço, ou vamos chamá-lo - para um determinado tipo de mercadoria. E esse público é diferente, pois não quer contar nada ao vendedor. Ela quer entrar e conseguir o que lhe interessa de alguma forma explícita ou implícita. Naturalmente, ninguém vem ao "M. Vídeo ", não quer se comunicar com nenhum vendedor, não quer entender, não quer responder a nenhuma de suas perguntas.

Portanto, a primeira história segue tudo isso.

Quando a tecnologia de adquirir conhecimento adicional apareceu para não se comunicar com uma pessoa de alguma maneira. Todos gostamos quando ligamos para o banco, e o banco nos diz: “Olá. Alexey, você é nosso cliente VIP. Algum super-gerente falará com você agora. Você vem a este banco e realmente há um gerente único que pode conversar com você. Infelizmente ou felizmente, nenhuma empresa descobriu ainda como contratar mil gerentes pessoais para mil clientes; e como a maioria dessas pessoas agora está on-line, a tarefa é entender que tipo de pessoa é essa e como se comunicar com ela corretamente antes que ele chegue a algum recurso de publicidade. E, portanto, de fato, existem tecnologias que estão tentando resolver esse problema.

Mineração de dados é o novo petróleo


Imagine que você é o proprietário de uma banca de flores. Três pessoas vêm até você. O primeiro fica por muito tempo, hesita, tenta falar com você, pega algum tipo de buquê - você sai para embrulhá-lo, sai para fazer alguma coisa lá; com este buquê, ele foge da baia - você perdeu seus três mil rublos. Por que isso aconteceu? Você não sabe nada sobre essa pessoa: não conhece sua história de pulsões no Ministério da Administração Interna, não sabe que ele é um cleptomaníaco, está registrado em um dispensário psiquiátrico. Porque Porque você o viu pela primeira vez e não é especialista em análise comportamental.

Algo mais vem ... Vitaly. Vitaly também entende há muito tempo, ele diz: "Bem, agora, eu preciso disso, daquilo." E você diz a ele: - Flores para a mãe, certo? E você vende um buquê para ele.

O conceito aqui é descobrir dados suficientes para entender o que essa pessoa precisa. Todos imediatamente pensaram em algum tipo de rede de publicidade e assim por diante ...

Todo mundo provavelmente já ouviu a frase estúpida repetidamente que "dados são novos petróleo"? Certamente todos ouviram. De fato, as pessoas aprenderam a coletar dados há muito tempo, mas extrair dados desses dados é a tarefa que a inteligência artificial está tentando resolver no marketing, ou algum tipo de algoritmo estatístico. Porque Porque se você conversar com uma pessoa, ela poderá lhe dar a resposta certa, errada ou de alguma forma manchada. A piada que eu digo aos alunos - como as pesquisas diferem das estatísticas - vou lhe dizer na forma de uma piada:

Assim, em duas aldeias, eles decidiram realizar um estudo sobre a duração média da dignidade masculina. Então, na primeira vila, Villaribo, o comprimento médio é de 15 centímetros, na vila de Villabaggio - 25. Você sabe por quê? Porque na primeira aldeia medições foram tomadas, e na segunda - uma pesquisa.

Indústria pornô - o carro-chefe dos sistemas de recomendação


É por isso que a abordagem moderna de analisar todas as pessoas sem exceção, mesmo que seja um pouco menos de 100%, mas essas são pessoas que não precisam ser solicitadas, não precisam ser examinadas. Basta analisar o que agora é chamado de pegada digital, a fim de entender o que essa pessoa precisa, como conversar com ele corretamente, como formar adequadamente a demanda ao seu redor. Por um lado, esta é uma máquina irracional (mas todos sabemos disso muito bem); não queremos nos comunicar com pessoas de M. Vídeo ”e, mais ainda, acessando recursos como“ Pornhub ”, queremos obter exatamente o que precisamos.

Por que eu estou sempre falando sobre pornhub? Porque a indústria adulta é a primeira que chegou à análise de tecnologias semelhantes, à introdução de tecnologias semelhantes e à análise de dados. Se você usar as três bibliotecas mais populares nessa área (por exemplo, TensorFlow ou Pandas para o "arremessador", para processar csv-shek e assim por diante), se você abrir no "Github", com um breve "google", todos esses nomes encontrarão algumas pessoas que trabalharam ou estão atualmente trabalhando no Pornhub e os primeiros a implementar exatamente os sistemas de recomendação. Em geral, essa história é muito avançada e mostra o quanto esse público é, o quanto essa empresa avançou.



Três níveis de identificação


Ao redor da pessoa, há um enorme conjunto de dados que podem ser identificados. Normalmente, divido-o formalmente em três níveis, mergulhando cada vez mais fundo. Naturalmente, a empresa possui seus próprios dados.

Se, digamos, estamos falando sobre a construção de um sistema de recomendação, o primeiro nível são os dados localizados perto da própria loja (histórico de compras, todos os tipos de transações, como uma pessoa interagiu com a interface).

Depois, há um nível (relativamente o maior) - isso é chamado de código aberto. Não pense que exorto a analisar as redes sociais, mas, na verdade, o que está em código aberto abre um enorme conjunto de dados que você pode contar sobre uma pessoa para aprender.

E a terceira parte principal é o ambiente dessa pessoa. Sim, existe uma opinião de que, se uma pessoa não está nas redes sociais - não há dados sobre ela (você provavelmente já sabe que isso não é verdade), mas o mais importante é que os dados que estão no perfil da pessoa (ou em algum aplicativo) ) - este é apenas 40% do conhecimento que pode ser obtido sobre ele. A informação restante é obtida de seu entorno. A frase "me diga quem é seu amigo e eu direi quem você é" assume um novo significado no século 21, porque uma enorme quantidade de dados pode ser obtida em torno dessa pessoa.

Falando mais próximo das comunicações de publicidade, obter comunicação de publicidade não é de publicidade, mas de algum amigo, conhecido ou pessoa de alguma forma verificada - esse é um recurso muito interessante que muitos profissionais de marketing usam. Quando algum tipo de aplicativo repentinamente fornece um código promocional gratuito, você posta sobre ele e atrai um novo público. De fato, esse código promocional para o Yandex.Taxi condicional não foi escolhido aleatoriamente e, para isso, uma enorme quantidade de dados foi analisada sobre o seu potencial de atrair um novo público e de alguma forma interagir com ele.



Eles até analisam o comportamento dos heróis da série


Vou mostrar três fotos e você me diz qual é a diferença entre elas.

Este aqui:



Este aqui:



E este:



Qual é a diferença entre eles? Tudo é simples aqui. Como na mecânica quântica, neste caso, esse criativo foi formado por um observador. Ou seja, a diferença na mesma campanha publicitária realizada pela mesma marca ao mesmo tempo, apenas na pessoa que assistiu a esse criativo. Pessoalmente, quando vou para a Amediateka, eles ainda mostram Khala Drogo. Não sei o que a Amediateka pensa das minhas preferências, mas de alguma forma isso acontece.

O que agora é chamado de comunicação personalizada é a história mais popular de atrair um público e interagir adequadamente com ele. Se, no primeiro estágio, identificamos pessoas usando nossos próprios dados de marca, dados de código aberto e, por exemplo, os dados ambientais dessa pessoa, podemos analisá-la e entender quem ele é, como falar com ela corretamente e, mais importante, em que idioma fale com ele.

Aqui a tecnologia foi tão longe que os heróis da série que uma pessoa está olhando estão sendo analisados. Ou seja, você gosta da série - eles se parecem, assistem, com quem você interagiu, a fim de entender qual pessoa é certa para você interagir com ela. Parece um absurdo completo, mas por uma questão de interesse em alguns dos recursos, tente - pessoas diferentes veem uma criatividade diferente (para interagir corretamente).

Nem um único meio de comunicação moderno ou qualquer recurso de vídeo mostra apenas notícias. Vá para a mídia - um grande número de algoritmos são carregados para identificá-lo, entender todas as suas atividades anteriores, apelar para o modelo mat e depois mostrar uma coisa. Neste caso, aqui está uma história tão estranha.

Como você define suas necessidades? Psicometria Fisionomia


Existem muitas abordagens (reais) para determinar as necessidades reais de uma pessoa e como se comunicar com ela corretamente. Existem muitas abordagens, todos decidem de maneiras diferentes, não se pode dizer quão bom, quão ruim. Parece básico, todo mundo sabe.



Psicometria Depois da história com a Cambridge Analytics, ela deu uma guinada chocante, na minha opinião, porque cada segunda empresa política agora vem e diz: “Oh, você pode fazer isso comigo como Trump? Eu também quero ganhar e assim por diante. ” De fato, é claro que isso não faz sentido para nossas realidades, por exemplo, eleições políticas. Mas três modelos são usados ​​para determinar psicotipos:

  • o primeiro é baseado no conteúdo que você consome - nas palavras que você escreve, em algumas informações que você gosta, vídeo, etc;
  • a segunda está ligada à maneira como você interage com a interface da web, como digita e quais botões pressionam - de fato, existem empresas inteiras que podem determinar com segurança o que agora é chamado de psicotipos usando a caligrafia do teclado.
  • Não sou muito psicólogo, não entendo muito bem como isso funciona, mas, do ponto de vista das comunicações publicitárias, o público dividido nesses segmentos funciona muito bem, porque alguém precisa mostrar uma tela vermelha com uma mulher azul, alguém precisa de um tom escuro. é um fundo azul com algum tipo de abstração e funciona muito bem. Em alguns níveis baixos - tanto que uma pessoa nem pensa nisso. Agora, qual é o principal problema no mercado publicitário? Todos são agentes dos serviços especiais, todos estão se escondendo, todo mundo tem um milhão de permissões de navegador instaladas para que não sejam identificadas de maneira alguma - você provavelmente possui Adblocks, Gostry e todos os tipos de aplicativos que bloqueiam o rastreamento. Por isso, é muito difícil entender algo sobre uma pessoa. E a tecnologia foi além - você precisa não apenas saber que essa pessoa retornou ao seu site pela 125ª vez, mas que ainda é uma pessoa tão estranha.

A fisionomia é uma ciência muito controversa. Nem sequer é considerado ciência. Este é um grupo de pessoas que costumava programar detectores de mentiras para algum Ministério do Interior, e agora eles estão envolvidos no que é chamado de personificação do criativo. A abordagem aqui é muito simples: tire algumas de suas fotos públicas de algumas redes sociais, usando-as para criar geometria tridimensional. E se você é um advogado, agora dirá que são dados pessoais e pessoais; e direi que esses são 300 mil pontos localizados no espaço, e isso não é uma pessoa e não são dados pessoais. É o que todo mundo costuma dizer quando Roskomnadzor chega até eles.

Mas, falando sério, separadamente, seu rosto, se seu nome e sobrenome não estiverem assinados lá, não são seus dados pessoais. A linha inferior é que os caras marcam várias características faciais que afetam como uma pessoa toma decisões e como interagir com ela. Em algum lugar, ele funciona mal em alguns segmentos da publicidade; em quais segmentos ele funciona muito bem. No final, acontece que, quando você acessa um determinado recurso, vê mais de um banner que é mostrado a todos, mas, por exemplo ... agora é normal fazer 16 ou 20 opções para diferentes públicos - e funciona muito bem. Sim, isso é ainda mais triste do ponto de vista do consumidor, porque as pessoas estão começando a manipular cada vez mais. No entanto, do ponto de vista comercial, isso funciona muito bem.

A caixa preta do aprendizado de máquina


Isso levanta o seguinte problema de tais tecnologias: afinal, para a maioria dos desenvolvedores agora, o que é chamado de aprendizado profundo é uma "caixa preta". Se você mergulhou nessa história e conversou com os desenvolvedores, eles sempre dizem: "Oh, escute, bem, temos algo tão incompreensível lá e não sabemos como funciona". Talvez alguém tenha.

Isso está realmente longe da verdade. O que agora é chamado de aprendizado de máquina está longe de ser uma caixa preta. Há um grande número de abordagens para descrever os dados de entrada e saída e, no final, a empresa pode entender completamente, com base nos sinais que a máquina decidiu mostrar a você este vídeo pornográfico ou outro. A questão é que nenhuma das empresas nunca revela isso, porque: primeiro, um segredo comercial; segundo, haverá uma enorme quantidade de dados que você nem sabia.

Por exemplo, antes disso, em uma discussão sobre ética, discutimos como as redes sociais analisam mensagens pessoais para marcar pessoas em algum tipo de história publicitária. Você escreve algo para alguém - com base nisso, obtém uma certa etiqueta para, de fato, algum tipo de comunicação publicitária. E você nunca provará isso, e provavelmente não faz sentido prová-lo. No entanto, se tais modelos fossem revelados, seriam. Acontece que o mercado para a construção de tais sistemas de recomendação finge não saber por que isso aconteceu.

As pessoas não querem saber o que sabem sobre elas.


E a segunda história é que o cliente nunca quer saber por que ele recebeu esse anúncio específico, esse produto específico. Vou lhe contar uma história. Minha primeira experiência na implementação comercial de sistemas de recomendação baseados em tais algoritmos foi em prol de pesquisas em 2015 em uma rede muito grande de sex shops (sim, essa também não é uma história muito hospitaleira).



Os clientes receberam o seguinte: eles efetuam login, acessam suas redes sociais; em 5 segundos, recebem uma loja totalmente personalizada, ou seja, todos os produtos foram alterados diretamente - eles se enquadram em uma determinada categoria e assim por diante. Você sabe quanto aumentou a conversão desta loja? Nem um pouco! As pessoas entraram e imediatamente acabaram. Eles entraram e perceberam que lhes era oferecido exatamente o que estavam pensando ...

O problema desse teste foi que, em cada produto, estava escrito por que eles lhe ofereciam exatamente isso ("porque você está no grupo oculto" A mulher imperiosa procura um homem - "trapo"). Portanto, os modernos sistemas de recomendação nunca mostram os dados com base nos quais a “previsão” foi feita.

A mídia é uma história muito popular porque todos eles usam sistemas de referência semelhantes. Anteriormente, os algoritmos eram muito simples: consulte a categoria "Política" - eles mostrarão as notícias da categoria "Política". Agora tudo é tão complicado que eles analisam os locais onde você parou o mouse, em quais palavras você se concentrou, o que copiou e como interagiu com esta página. Então ele analisa o vocabulário das próprias mensagens: sim, você não está apenas lendo as notícias sobre Putin, mas de certa maneira, com certa cor emocional. E quando uma pessoa recebe algumas notícias, ela nem pensa em como veio aqui. No entanto, então interage com este conteúdo.

Tudo isso, é claro, visa manter um homem pobre e infeliz, que é tão louco pela enorme quantidade de informações que o rodeiam. Deve-se dizer aqui que seria bom usar esses sistemas para personificar a criatividade ao seu redor, coletar algumas informações, mas, infelizmente, até agora não existem tais serviços.

A inteligência artificial captura o cliente na decolagem e forma a demanda


E aqui surge uma questão filosófica muito interessante, passando da criação de um sistema de recomendação para a formação da demanda. Raramente alguém pensa sobre isso, mas quando você tenta perguntar ao Instagram condicional: “Por que você está coletando dados? Por que não me mostrar um anúncio absolutamente aleatório? ”,“ Instagram ”dirá:“ Amigo, tudo foi feito para mostrar exatamente o que você está interessado. ” Definitivamente, queremos conhecê-lo para mostrar exatamente o que você está procurando.



Mas a tecnologia há muito ultrapassa esse marco terrível, e tecnologias similares não preveem mais o que você precisa. Eles (atenção!) Formam a demanda. Essa é provavelmente a pior coisa que gira em torno da inteligência artificial nessas comunicações. É terrível que ele tenha sido usado quase universalmente nos últimos 3 a 5 anos - da emissão do Google à emissão do Yandex, a alguns sistemas ... Ok, não vou dizer nada ruim sobre o Yandex; e bom

Qual é o objetivo? Essas comunicações publicitárias deixaram de ser estratégicas quando você escreve "Quero comprar uma cadeira de criança" e vê cem mil milhões de publicações. Eles continuaram com o seguinte: apenas uma mulher postou uma foto com uma barriga pouco visível, seu marido imediatamente começou a buscar mensagens - “Cara, logo a entrega. Compre uma cadeira de bebê. "

Aqui você pergunta razoavelmente por que, com esses avanços tecnológicos gigantescos, ainda vemos anúncios de merda nas redes sociais? O problema é que o dinheiro ainda resolve tudo neste mercado, então, em algum momento, um anunciante como a "Coca-Cola" pode vir e dizer: "Aqui você tem 20 milhões - mostre meus banners de merda para toda a Internet". E eles realmente fazem isso.

Mas se você fizer algum tipo de conta limpa e testar com que precisão esses algoritmos irão adivinhar você: eles primeiro tentam adivinhar você e depois começam a fazer algo com antecedência. E o cérebro humano trabalha de tal maneira que, recebendo informações confiáveis, nem sequer processa o momento em que recebeu essas informações. A primeira regra é determinar que você está sonhando - você precisa entender como você veio aqui. Uma pessoa nunca se lembra do momento em que estava em uma sala. É o mesmo aqui.

Google pode começar a moldar sua visão de mundo


Tais estudos foram realizados por várias empresas estrangeiras envolvidas no rastreamento ocular. Eles colocam dispositivos em computadores especiais que registram a aparência dos olhos do sujeito. Peguei de cinco a sete mil voluntários que simplesmente rolavam a fita, interagiam com as redes sociais, com publicidade, e eles escreviam informações sobre quais partes dos banners e criativos essas pessoas paravam de procurar.

E, quando as pessoas obtêm um criativo tão super-personalizado, nem sequer pensam nisso - eles imediatamente passam por cima e começam a interagir com ele. Do ponto de vista dos negócios, isso é bom, mas do ponto de vista de nós, como usuários, isso não é muito legal, porque - do que eles têm medo? - Que em um belo momento o "Google" condicional pode começar (e, é claro, nem mesmo começar) a formar sua própria visão de mundo. Ele pode amanhã, por exemplo, começar a mostrar às pessoas que a terra é plana.

É uma piada, mas eles foram pegos um grande número de vezes que, durante as eleições, começaram a dar certas pessoas certas informações. Estamos todos acostumados ao fato de que o mecanismo de pesquisa obtém tudo honestamente. Mas, como sempre digo, se você realmente quiser saber como o mundo funciona, escreva seu próprio mecanismo de pesquisa, sem filtros, sem prestar atenção aos direitos autorais, sem classificar nenhum de seus amigos na lista. A emissão de dados reais na Internet geralmente é diferente do que o Google, Yandex, Bing e outros mostram. Alguns materiais estão ocultos, porque amigos, colegas, inimigos ou outra pessoa (ou um ex-amante com quem você dormiu) não importa.

Como o trunfo venceu


Quando a última eleição nos EUA foi realizada, um estudo muito simples foi realizado. Eles aceitaram os mesmos pedidos em lugares diferentes, de IPs diferentes, de cidades diferentes, pessoas diferentes pesquisaram a mesma coisa no Google. Convencionalmente, o pedido estava no estilo de: quem vencerá a eleição? E, surpreendentemente, foram construídos os resultados de que, nos estados em que o maior número de pessoas tentou votar no candidato errado, eles receberam boas notícias sobre o candidato promovido pelo Google. Qual? Bem, está claro o que - aquele que se tornou presidente. Esta é uma história absolutamente improvável, e todos esses estudos - com o dedo na água. O Google pode dizer: "Pessoal, tudo isso é feito para mostrarmos o conteúdo mais relevante para você".

A partir de agora, você deve saber que o que é chamado de mais relevante não é um figo. A empresa chama relevante o que você precisa vender por alguns motivos bons ou ruins.

Quem não tem dinheiro agora já está se preparando para compras futuras


Ainda existe um momento tão interessante sobre o qual vou falar. Um grande número de audiências ativas estão agora em redes sociais, em aplicativos - esses são jovens. Nós chamamos assim - jovens insolventes: crianças de 8 a 9 anos que clicam em jogos idiotas, são 12-13-14 que só se registram nas redes sociais. Por que grandes empresas gastariam enormes orçamentos e recursos para criar aplicativos para públicos insolventes que nunca são monetizados? No momento em que esse público se tornar solvente, haverá dados suficientes para prever muito bem seu comportamento.



Agora pergunte a qualquer targetologista qual é o público mais difícil? Eles dirão: altamente lucrativo. Porque vender, por exemplo, um apartamento no valor de 150 milhões de rublos através das redes sociais é quase impossível. Casos isolados, quando você faz algum tipo de publicidade para 10 mil pessoas, compra-se este apartamento - o cliente tem sucesso ... Mas um em cada dez mil, do ponto de vista das estatísticas, é uma porcaria completa. Então, por que é difícil identificar um público altamente lucrativo? Como as pessoas que agora são membros de um público altamente lucrativo nasceram quando a Internet ainda era muito pequena, quando Artemy Lebedev ainda não sabia, e não há informações sobre elas. É impossível prever seu modelo de comportamento, é impossível entender quem os líderes pensam por eles, de quais fontes de conteúdo eles aceitam.

Portanto, quando todos vocês se tornarem bilionários em 25 anos, e as empresas que vão vender alguma coisa terão uma quantidade enorme de dados. Portanto, um GDPR notável apareceu agora na Europa, o que impede a coleta de dados de menores.

Naturalmente, esse figo não funciona na prática, pois todas as crianças ainda brincam com as contas dos pais, da mãe - assim, as informações são coletadas. Da próxima vez que você der um tablet ao seu filho, pense nisso.

Absolutamente não um futuro terrível e anti-utópico, quando todos morrem na guerra com as máquinas - uma história absolutamente real agora. Há um grande número de empresas que criam algoritmos para pessoas com perfil psicológico pela maneira como jogam. Indústria muito interessante. Com base nisso, as pessoas são segmentadas para que, de alguma forma, elas possam se comunicar com elas.



A previsão do comportamento dessas pessoas estará disponível em 10 a 15 anos - exatamente no momento em que elas se tornarem um público solvente. Mais importante, essas pessoas já deram permissão prévia para processar seus dados pessoais, transferi-los para terceiros e tudo isso é felicidade, e assim por diante.

Quem vai perder um emprego?


E a última história que tenho é que todo mundo sempre pergunta o que acontecerá em 50 anos: todos nós morreremos, haverá desemprego dos profissionais de marketing ... Existem profissionais de marketing preocupados com o desemprego, certo? Preocupar-se, em geral, não vale a pena, porque qualquer pessoa altamente qualificada não perde o emprego.



Não importa quais algoritmos sejam criados, não importa quanto o carro chegue ao que temos aqui (aponta para a cabeça), se ele se desenvolver rápido o suficiente, essas pessoas nunca ficarão ociosas, porque alguém terá que usar esses criativos fazer. Sim, existem todos os tipos de "ghans" que desenham figuras que parecem pessoas, criam música, mas ainda assim, é improvável que um dia as pessoas percam o trabalho nessa área.



Eu tenho tudo na história, então você pode fazer perguntas se tiver mais. Obrigada



Apresentador: - Amigos, agora estamos migrando para o bloco de perguntas e respostas. Você levanta a mão - eu venho até você.



Pergunta do público (H): - Pergunta sobre a "caixa preta". Eles disseram que você pode entender especificamente por que exatamente esse resultado é para esse usuário. Estes são algum tipo de algoritmo, ou é o tempo todo para cada modelo ad hoc (nota do autor: “especialmente para isso” - unidade fraseológica latina) que você precisa analisar? Ou já existem redes prontas para alguma rede neural, você pode entender, grosso modo, o significado do negócio?

AH:- Aqui você precisa entender o seguinte: no aprendizado de máquina, há um grande número de tarefas. Por exemplo, há uma tarefa - regressão. Para a regressão, nenhuma rede neural é necessária. Tudo é simples lá: você tem vários indicadores, precisa calcular o seguinte. Há tarefas em que é necessário recorrer a algo como aprendizado profundo. De fato, no aprendizado profundo, é difícil entender de forma confiável quais pesos foram definidos para quais neurônios, mas legalmente tudo o que você precisa fazer é entender quais dados estavam na entrada e como foram executados. Isso é legal o suficiente para patentear tal decisão e é suficiente para entender com base na qual a história foi adotada.

Você não acessou o site e recebeu algum tipo de banner porque fotografou no Instagram há dois meses com cabelos ruivos. Se o desenvolvedor não definir a coleta desses dados, a marcação da cor do cabelo neste modelo, eles não serão retirados do teto.

Como vender os resultados dos sistemas de aprendizado de máquina?


Z: - Apenas a questão é: é entender como explicar, vender para alguém que não entende de aprendizado de máquina. Quero dizer: meu modelo - da cor do cabelo claramente leva a ... bem, a cor do cabelo muda ... Isso é possível ou não?



AH: - Talvez sim. Mas, do ponto de vista das vendas, o único esquema funcionará: você tem uma campanha publicitária, substituímos o público-alvo pelo que a máquina forma - e você apenas observa o resultado. Infelizmente, essa é a única opção confiável do cliente para convencer que essa história funciona, porque existem muitas soluções no mercado que foram implementadas e que não funcionaram.

Sobre como criar uma identidade virtual


Z: - Olá. Obrigado pela palestra. A questão é: qual é a chance de uma pessoa que, por algum motivo, não desejar seguir o aprendizado de máquina, criar uma personalidade virtual fundamentalmente diferente de sua própria personalidade, por meio da interação com a interface ou por outros motivos?



AH: - Existem vários plugins diferentes que lidam especificamente com a randomização do comportamento. Há uma coisa legal - o Ghostery, que, na minha opinião, quase o esconde completamente de um monte de rastreadores diferentes que não podem gravar essas informações. Mas, na verdade, agora um perfil fechado nas redes sociais será suficiente para você, para que ninguém, nenhum analisador maligno colete qualquer coisa lá. Provavelmente é melhor colocar algum tipo de extensão ou escrever algo você mesmo.

Veja bem, esse é um conceito que, legalmente, por exemplo, dados pessoais se refere a dados pelos quais você pode ser identificado, e a lei fornece como exemplo o endereço do local de residência, idade e assim por diante. Agora, os dados pelos quais você pode ser identificado são incontáveis: a mesma caligrafia do teclado, a mesma impressora, a assinatura digital do navegador ... Mais cedo ou mais tarde, a pessoa está enganada. Ele pode sentar-se em algum lugar do "café" através do "Tor", mas no final, a certa altura, ele esquecerá de ativar a VPN ou outra coisa e, nesse momento, poderá ser identificado. Portanto, a maneira mais fácil é criar uma conta fechada e instalar algum tipo de extensão.

O mercado está caminhando para o fato de que você precisa pressionar apenas um botão para obter o resultado


Z: - Obrigado pela história. Como sempre, é sempre interessante (eu sigo você). A questão é: qual é o progresso em termos de criação de sistemas fáceis de usar de sistemas de recomendação? Você disse que uma vez esteve envolvido em sistemas de recomendação para encontrar um parceiro sexual, amigo da vida (ou música que uma pessoa possa gostar) ... Quão promissor é tudo isso e como você vê seu desenvolvimento precisamente do ponto de vista da criação dos sistemas que as pessoas precisam?

AH:- Em geral, o mercado está caminhando para o fato de que as pessoas precisam pressionar um botão e obter imediatamente o que precisam. Quanto à minha experiência na criação de aplicativos de namoro (a propósito, vamos reiniciá-lo no final do ano), além de 65% serem homens casados, o problema de recomendação mais difícil foi que vários modelos foram oferecidos à pessoa no início do aplicativo - “ Amizade ”,“ Sexo ”,“ Amizade Sexual ”e“ Negócios ”. As pessoas não escolheram o que precisavam. Os homens vieram escolher o "Amor", mas na verdade jogaram nus para todos, e assim por diante.

O problema era identificar uma pessoa que não se encaixa em nenhum desses modelos e, de alguma forma, levá-la e movê-la para o outro lado. Devido à pequena quantidade de dados, é muito difícil determinar se esse é um erro no algoritmo de previsão ou se uma pessoa não está em sua categoria. O mesmo acontece com a música: existem muito poucos algoritmos realmente válidos que são bons para compor músicas. Talvez Yandex.Music. Alguém considera o algoritmo Yandex.Music ruim. Por exemplo, eu gosto dela. Por exemplo, eu pessoalmente não gosto do algoritmo de música do YouTube e assim por diante.

Existem, é claro, suas sutilezas - tudo está ligado a licenças ... Mas, na verdade, a demanda por esses sistemas é bastante grande. A empresa Retail Rocket, que estava envolvida na implementação de sistemas de recomendação, era conhecida ao mesmo tempo, agora de alguma forma não vive muito bem - aparentemente porque eles não desenvolveram seus próprios algoritmos por um longo tempo. Tudo vai para isso - nós entramos e, sem pressionar nada, conseguimos o que precisamos (e completamente idiota, porque a capacidade de escolher desapareceu completamente de nós).

Marketing de influenza


Z: - Olá. Meu nome é Konstantin. Eu gostaria de fazer uma pergunta sobre o marketing de influência. Você conhece algum sistema que permita que uma empresa escolha um blogueiro adequado para uma empresa com base em algumas estatísticas e assim por diante? E com que base isso é feito?



AH: - Sim, vou começar de longe e imediatamente dizer que o problema com todas essas tecnologias é que toda essa inteligência artificial do marketing está se movendo como um andador na corda bamba: existem grandes empresas à esquerda que têm muito dinheiro e terão de qualquer maneira tudo funciona de maneira eficiente, porque suas campanhas publicitárias visam simplesmente a visualização; por outro lado, há um monte de pequenas empresas para as quais não funcionará, porque elas têm muitos dados. Até agora, a aplicabilidade dessas histórias está em algum lugar no meio.

Quando já existem bons orçamentos, e a tarefa é processá-los corretamente (e, em princípio, já existem muitos dados) ... Conheço alguns serviços, algo como o "Getblogger", que parece ter algoritmos. Sinceramente, não estudei esses algoritmos. Posso dizer qual abordagem usamos para procurar líderes de opinião quando algumas mães precisam dar um presente.

Usamos uma métrica chamada Tempo de Distribuição de Conteúdo. Funciona da seguinte maneira: você pega a pessoa cujo público-alvo está analisando e precisa coletar sistematicamente (por exemplo, a cada 5 minutos) informações sobre quem postou, comentou e assim por diante. Assim, será possível entender em que momento cada pessoa de seu público interagiu com seu conteúdo. Repita esta operação para cada representante de seu público e, portanto, usando a métrica do tempo médio de distribuição do conteúdo, ela pode, por exemplo, ser lançada em cores em um grande gráfico de rede dessas pessoas e usar essa métrica para criar clusters.

Isso funciona muito bem se quisermos, por exemplo, encontrar 15 mães que mantêm sua opinião pública em alguma mulher.ru. Mas essa é uma implementação técnica bastante complicada (embora seja teoricamente possível também fazer isso no Python). O ponto principal é que o problema do marketing de influência nas grandes agências de publicidade é que elas precisam de blogueiros grandes, legais e caros, que não fazem nada. Bem, a marca de automóveis quer vender algum produto através de algum tipo de líder de opinião - eles precisam usar o blogueiro de automóveis por último, porque o público daqueles que já comprou um carro ou sabe com certeza qual carro deseja, apenas olha para carros descolados. Aqui é importante não perder a análise da audiência da própria pessoa.

Bots de marketing


Z: - Diga-me, com que intensidade os bots nas redes sociais afetam a coleta de informações e sua qualidade?



AH: - Com bots, uma coisa tão interessante. Bots baratos são fáceis de identificar - eles têm o mesmo conteúdo ou são amigos uns dos outros ou estão em uma única grade. Com bots complexos, também existem abordagens. Ou você está perguntando uma tarefa de como amarrar uma pessoa à sua falsificação?

Z: - Quanta informação de qualidade será produzida com todo esse lixo?

AH: - Aqui funciona da seguinte maneira: devido ao fato de haver uma enorme quantidade de dados (por exemplo, para algum tipo de pesquisa de marketing), você pode simplesmente jogar fora todo esse shusher. Ou seja, é melhor lançar um pouco mais de pessoas reais do que capturar bots, porque é inútil exibir todos os tipos de anúncios. Mas se você coletar métricas, por exemplo, interações com banners ou sistemas de recomendação, essas contas poderão ser descartadas.

Atualmente, existem seis caracteres virtuais nas redes sociais ou simplesmente páginas esquerdas ou introvertidos, que os algoritmos “combinam” como bots. Quanto a vincular uma pessoa ao seu falso, tudo aqui também está ligado ao fato de que uma pessoa cometerá um erro mais cedo ou mais tarde, e o fato é que o modelo de comportamento é o mesmo - o de sua conta real, o de seu falso. Mais cedo ou mais tarde, eles assistirão ao mesmo conteúdo ou a qualquer outra coisa.

Tudo se resume não à porcentagem de erro, mas à quantidade de tempo necessária para uma identificação confiável de uma pessoa. Para alguém que vive com seu Instagram, esse tempo de identificação confiável se reduz a cinco minutos. Para alguém - de seis a oito meses.

Para quem e como vender dados?


Z: - Olá. Estou interessado em saber como os dados são vendidos entre empresas? Por exemplo, eu tenho um aplicativo no qual você pode descobrir (para o desenvolvedor) onde uma pessoa vai, quais lojas e quanto dinheiro ele gasta lá. E estou interessado em saber como, digamos, vender essas informações sobre o público dessas lojas para essas lojas ou jogar seus dados em um grande banco de dados e ser pago por isso?



AH: - Quanto à venda de dados diretamente a alguém - você, todo o resto, foi superado pelos operadores de dados fiscais do OFD, que inteligentemente construíram entre a transferência de cheques e o Imposto e agora estão tentando vender tudo para todos. De fato, eles colapsaram todo o mercado de análise móvel. De fato, você pode incorporar seu aplicativo, por exemplo, um pixel do Facebook, seu sistema DMP; depois use esse público para vender. Por exemplo, o pixel "Pode segmentar". Não sei apenas o tipo de público que você precisa entender. Em qualquer caso, você pode integrar o Yandex ou o My Target, que são os maiores sistemas DMP.

Esta é uma história bastante interessante. O único problema é que você fornece todo o tráfego para eles, e eles assumem a monetização desse tráfego como trocas. Eles podem dizer que 10 pessoas usaram seu público-alvo ou não. Portanto, você cria sua rede de anunciantes ou se entrega a um DMP grande.

Quem vencerá - um artista ou um técnico?


Z: - Uma pergunta um pouco distante da parte técnica. Foi dito sobre os medos dos profissionais de marketing sobre o iminente desemprego em massa. Existe algum tipo de competição entre o marketing criativo (esses caras que criaram anúncios de frango, os anúncios da Volkswagen parecem ser) e aqueles que lidam com o Big Date (que dizem: nós apenas coletamos todos os dados e entregamos anúncios direcionados a todos )? Como pessoa diretamente envolvida, qual é a sua opinião, quem vencerá - um artista, um técnico ou será algum tipo de efeito sinérgico?



AH: - Ouça, bem, eles trabalham juntos. Engenheiros não inventam a criatividade. Aqueles que são criativos não têm uma audiência. Há uma certa história multidisciplinar. Na realidade, aqueles que estão sentados e pressionando botões agora têm problemas, aqueles que fazem "chamarizes" pressionam a mesma coisa todos os dias - essas pessoas desaparecem.

Mas quem analisa os dados permanece naturalmente, mas alguém precisa processá-los. Alguém terá que criar essas figuras e desenhá-las. Uma máquina tão criativa não vai aparecer! Isso é loucura completa! Ou como, por exemplo, a publicidade viral Carprice, que, aliás, funcionou muito bem. Lembre-se, isso foi no YouTube: "Venda na Carprais", ela é absolutamente insana. Obviamente, nenhuma rede neural irá gerar tal história.
Eu geralmente advogo que nem as pessoas perderão seus empregos, mas terão um pouco mais de tempo livre e poderão gastar esse tempo livre em auto-educação.

A publicidade primitiva morrerá


Z: - Em geral, os anúncios exibidos, banners - no mesmo local, até os textos de venda não são escritos lá: “Precisamos de janelas - pegue!”, “Você precisa de outra coisa - pegue!”, Ou seja, não há criativo .

AH: - Essa publicidade morrerá, é claro, mais cedo ou mais tarde. Ele morrerá não tanto por causa do desenvolvimento da tecnologia, mas quanto por causa do desenvolvimento de você e eu.

O relevante é melhor misturado com o irrelevante


Z: - Estou aqui! Tenho uma pergunta sobre um experimento que, como você disse, não teve êxito (com um sistema de recomendação). E, na sua opinião, o problema é que ele foi assinado lá, por que é recomendado ou que tudo o que o usuário viu era relevante para ele? Como li um experimento para mães, e não havia muitos dados lá e não havia muitos dados da Internet, havia apenas os dados de um varejista de alimentos - gravidez prevista (que seriam mães). E quando eles mostraram uma seleção de produtos para gestantes, as mães ficaram horrorizadas ao saber sobre elas antes de algumas coisas oficiais. E não deu certo. E para resolver esse problema, eles deliberadamente misturaram bens relevantes com algo completamente irrelevante.



AH: - Mostramos especificamente às pessoas com base nas recomendações feitas para entender seus comentários. Na verdade, a partir daqui nasceu o conceito de que as pessoas não precisam dizer que esses são alguns tipos de bens super-relevantes para ele.

Sim, a propósito, existe uma abordagem para misturá-los com os irrelevantes. Mas há o oposto: às vezes as pessoas entram e interagem com esse produto irrelevante - emissões aleatórias são obtidas, modelos quebram e tudo fica ainda mais complicado. Mas é mesmo. Além disso, muitas empresas especificamente, se elas sabem que alguém está processando seus dados (alguém pode roubar esse retorno delas), elas as misturam especialmente às vezes, para que você possa provar mais tarde que não retirou os dados de seu sistema de recomendação, mas a partir do Yandex.Market condicional.

Bloqueadores de anúncios e segurança do navegador


Z: - Olá. Você mencionou Ghostery e Adblock. Você pode me dizer como esses rastreadores geralmente são eficazes (talvez de acordo com as estatísticas)? E você recebeu pedidos de empresas: eles dizem, verifique se nossos anúncios não puderam ser fechados pelo Adblock.

AH: - Não entramos em contato diretamente com as plataformas de publicidade - justamente porque eles não pediram para garantir que todos vissem seus anúncios. Eu pessoalmente uso o Ghostery - acho que é uma extensão muito legal. Agora, todos os navegadores estão lutando pela privacidade: a Mozilla lançou um monte de todos os tipos de atualizações, o Google Chrome agora é super-segurança. Todos eles bloqueiam tudo o que é possível. O Safari já desativou o giroscópio por padrão.
E essa tendência, é claro, é boa (não para quem coleta dados, embora também tenha saído), porque as pessoas primeiro bloquearam os cookies. Todo mundo que possuía redes de anúncios lembrava de uma tecnologia tão maravilhosa quanto as impressões digitais dos navegadores - estes são algoritmos que recebem 60 parâmetros diferentes (resolução de tela, versão, fontes instaladas) e calculam um "identificador" exclusivo com base neles. Nós mudamos para isso. E os navegadores começaram a lutar com isso. Em geral, será uma batalha sem fim dos titãs.

O mais recente desenvolvimento "Mozilla" é bastante protegido. Ela praticamente não salva nenhum cookie, define uma vida útil curta. Especialmente se você ativar o modo de navegação anônima, ninguém o encontrará. A questão é que será inconveniente inserir senhas em todos os serviços.

Onde a psicotipagem e a fisionomia funcionam e não funcionam?


Z: - Arthur, muito obrigado pela palestra. Também com prazer sigo suas palestras no "YouTube". Você mencionou que os profissionais de marketing recorrem cada vez mais ao uso de psicotipagem e fisionomia. Minha pergunta é: em quais categorias de marcas funciona? Minha crença é que é adequado apenas para FMCG. Por exemplo, escolher um carro é ...

AH: - Posso fazer o download exatamente onde funciona. Ele funciona em todos os tipos de histórias, como Amediateki, programas de TV, filmes e assim por diante. Isso funciona bem em bancos e produtos bancários, se este não for um segmento premium, mas todos os tipos de cartões de estudante, parcelas - estas são as coisas. Realmente funciona muito bem no FMCG e em todos os tipos de "iPhones", carregadores, em toda essa confusão. Funciona bem nos produtos "da mãe", "do pai". Embora eu saiba que na pesca (existe esse tópico) ... Várias vezes houve casos com pescadores - eles nunca podem ser segmentados de maneira confiável. Não sei porque. Algum tipo de erro estatístico.

Isso não funciona bem com os motoristas, com jóias, com algumas coisas para o lar. Na verdade, isso não funciona bem com algo sobre o qual as pessoas nunca teriam escrito nas redes sociais - você pode conferir dessa maneira. Condicionalmente, com a compra de uma máquina de lavar: veja como entender quem tem uma máquina de lavar e quem não tem? Parece que todo mundo tem. Você pode usar os dados do CRF - para ver quem comprou o que com cheques, para "pegar" essas pessoas com cheques. Mas, de fato, coisas que você nunca teria contado, por exemplo, no Instagram, é difícil trabalhar com essas coisas.

Máquinas reconhecem truques como jogadas estatísticas.


Z: - Eu tenho uma pergunta sobre segmentação. É possível (ou de repente eles existem) um personagem aleatório condicional que se contradiz em tudo: no começo, ele busca no Google "os melhores ginásios" e depois no Google "10 maneiras de não fazer nada"? E assim em tudo. A segmentação pode seguir uma que se contradiga?

AH: - A única pergunta aqui é: se você usou o Google por 2 anos, contou a ele tudo o que pode sobre si mesmo e agora instala um plug-in que cria consultas aleatórias semelhantes; então, é claro, de acordo com as estatísticas, você pode vai entender - o que você está fazendo agora é um desvio estatístico, e a coisa toda é eliminar. Se você quiser - registre uma nova conta, mas o volume de publicidade não será alterado. Ela só vai se tornar estranha. Embora ela esteja estranha agora.


Um pouco de publicidade :)


Obrigado por ficar conosco. Você gosta dos nossos artigos? Deseja ver materiais mais interessantes? Ajude-nos fazendo um pedido ou recomendando aos seus amigos o VPS baseado em nuvem para desenvolvedores a partir de US $ 4,99 , um analógico exclusivo de servidores básicos que foi inventado por nós para você: Toda a verdade sobre o VPS (KVM) E5-2697 v3 (6 núcleos) 10 GB DDR4 480 GB SSD 1 Gbps de US $ 19 ou como dividir o servidor? (as opções estão disponíveis com RAID1 e RAID10, até 24 núcleos e até 40GB DDR4).

Dell R730xd 2 vezes mais barato no data center Equinix Tier IV em Amsterdã? Apenas temos 2 TVs Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV a partir de US $ 199 na Holanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - a partir de US $ 99! Leia sobre Como criar um prédio de infraestrutura. classe usando servidores Dell R730xd E5-2650 v4 custando 9.000 euros por um centavo?

Source: https://habr.com/ru/post/pt482816/


All Articles