Arthur Khachuyan:市场营销中的人工智能

Arthur Khachuyan是俄罗斯著名的大数据处理专家,Social Data Hub(现为Tazeros Global)的创始人。 HSE合作伙伴。 他与联邦委员会经济高等学校更高数据法案一起准备并提交,他在巴黎居里研究所,圣彼得堡国立大学,俄罗斯联邦政府下的联邦大学,红苹果公司,国际开放数据日,RIW 2016,AlfaFuturePeople。

该讲座于2019年在莫斯科露天节“极客野餐”上录制。



Arthur Khachuyan(以下称AH): -如果来自众多行业-从医学,建筑,某物,选择某物,其中最常使用大数据技术,机器学习,深度学习的技术,那么这可能是行销。 因为过去三年左右,某种广告传播中围绕我们的一切现在都专门与数据分析以及精确地与所谓的人工智能相关联。 因此,今天,我将从一个如此遥远的故事中告诉您有关...

如果您想象人工智能,它将是什么样子-可能就是这样。 这张奇怪的照片是我一年前写的神经网络之一,用来发现我的狗的行为的依赖性-她需要变大多少次,多少通常取决于它吃多少东西。 。 这是关于如何想象人工智能的笑话。



但是,让我们考虑一下这一切如何在广告传播中发挥作用。 广告和市场营销中的现代算法如何与我们互动具有三个方面。 显然,第一个故事旨在获取和提取有关我们的其他知识,然后将其用于一些良好而非很好的目的; 使每个人的方法个性化; 之后,自然会形成一定的需求,以完成主要目标动作并进行一定的销售。

他们正在尝试使用技术来解决有效沟通的问题。


如果我告诉你想想Pornhub和M之间有什么共同点。 视频”,您会怎么想?

观众的评论(以下简称-H): -Teleki,观众。

AH: -我的概念是,人们在这两个地方来获得某种类型的服务,或者我们称其为-某种类型的商品。 该受众群体的不同之处在于,它不想告诉卖方任何信息。 她想进去以某种显性或隐性形式获得她感兴趣的东西。 自然,没人会来“ M. 视频”,不想与任何卖家交流,不想了解,不想回答他们的任何问题。

因此,第一个故事就是从这一切得出的。

为了不以某种方式与人交流而获得更多知识的技术出现时。 我们打电话给银行时都喜欢,银行告诉我们:“您好。 阿列克谢,您是我们的VIP客户。 一些超级经理现在会与您交谈。” 您来到这家银行,确实有一位独特的经理可以与您交谈。 不幸或幸运的是,还没有一家公司想出办法为一千名客户雇用一千名个人经理。 并且由于这些人中的大多数人现在都在线,所以任务是在他获得一些广告资源之前,了解他是什么样的人以及如何与他正确地交流。 因此,实际上,有一些技术正在尝试解决此问题。

数据挖掘是新的石油


假设您是一个花摊的所有者。 三个人来找你。 第一个站了很长时间,犹豫了一下,试图和你说话,拿了些花束-你离开包裹,出去在那里做点什么; 带着这束花,他逃离了摊位-您损失了三千卢布。 为什么会这样呢? 您对这个人一无所知:您不知道他在内政部的驾驶经历,也不知道他是一名盗窃狂,是在精神病院注册的。 怎么了 因为您是第一次见到他,而且您不是行为分析专家。

还有别的东西了……维塔利。 Vitaly也了解很长时间,他说:“好吧,现在,我需要那个,那个,那个。” 然后你告诉他,-给妈妈的花,对吗? 然后你卖给他一束。

这里的概念是找出足够的数据以完全了解此人的需求。 每个人都立即想到了某种广告网络等等。

每个人都可能反复听到“数据就是新油”的愚蠢说法? 当然每个人都听到了。 实际上,人们早就学会了收集数据,但是从这些数据中提取数据是人工智能现在试图在市场营销中解决的任务,或者是某种统计算法。 怎么了 因为如果您与一个人交谈,他可以给您正确,错误或有色答案。 我向学生讲的笑话-民意测验与统计数字有何不同-我将以笑话的形式告诉您:

因此,他们决定在两个村庄里对男性尊严的平均长度进行研究。 因此,在第一个村庄Villaribo中,平均长度为15厘米,在Villabaggio村庄-25。您知道为什么吗? 因为在第一个村庄进行了测量,而在第二个村庄进行了测量。

色情行业-推荐系统的旗舰


这就是为什么现代分析方法无一例外地分析所有人的原因,即使他们略低于100%,但这些人不需要询问,也不需要观察。 分析一下现在所谓的数字足迹就足够了,以了解这个人的需求,如何与他正确交谈,如何正确地围绕他形成需求。 一方面,这是一台无脑的机器(但我们都非常了解); 我们不想与M的人交流。 视频”,更重要的是,通过访问“ Pornhub”之类的资源,我们希望获得所需的确切信息。

为什么我总是在谈论pornhub? 因为成人产业是第一个进入类似技术分析,引入类似技术,进行数据分析的行业。 如果您使用该区域中三个最受欢迎的库(例如,TensorFlow或Pandas用作“小投手”,用于处理csv-shek等),如果您在“ Github”上打开,并用简短的“ google”命名,那么您会发现几个人在Pornhub工作或目前在工作的人,那里的第一个完全实施推荐系统的人。 总的来说,这个故事非常先进,它显示了这个受众有多少,这家公司向前发展了多少。



三种识别级别


在人周围有大量可以识别的数据。 我通常将其正式分为三个层次,层次越来越深。 当然,公司拥有自己的数据。

例如,如果我们正在谈论构建推荐系统,那么第一层是位于商店本身附近的数据(购买历史,各种交易,人与界面的交互方式)。

然后是一个级别(相对最大)-这就是所谓的开源。 不要以为我敦促您解析社交网络,但是实际上,开源中的内容会提供大量数据,您可以告诉他们要学习的人。

第三部分是这个人自己的环境。 是的,有一种观点认为,如果某人不在社交网络中-就没有关于他的数据(您可能已经知道事实并非如此),但最重要的是,该人的个人资料(或某些应用程序中的数据) )-这只是可以获取的知识的40%。 其余信息是从他的周围环境中获得的。 “告诉我您的朋友是谁,我会说您的身份”一词在21世纪具有新的含义,因为可以从此人那里获得大量数据。

说到更接近广告传播,获得广告传播不是来自广告,而是来自您的一些朋友,熟人或经过某种方式验证的人—这是很多营销人员使用的非常酷的功能。 当某种类型的应用程序突然为您提供免费的促销代码时,您将其发布并吸引新的受众。 实际上,根本没有随机选择有条件的Yandex.Taxi的促销代码,为此,对大量数据进行了分析,以了解您吸引新受众并与之互动的潜力。



他们甚至分析了该系列英雄的行为


我将为您展示三张图片,您告诉我它们之间有什么区别。

这个:



这个:



而这个:



它们之间有什么区别? 这里的一切都很简单。 与量子力学一样,在这种情况下,此创意是由观察者组成的。 也就是说,同一品牌在同一时间进行的同一广告活动中的区别仅在于观看该广告素材的人。 就个人而言,当我去Amediateka时,他们仍然向Khala Drogo展示。 我不知道Amediateka对我的喜好有何看法,但不知何故发生了。

现在所谓的个性化交流是吸引观众并与之适当互动的最流行的故事。 如果在第一阶段我们使用自己的品牌数据,开源数据以及例如此人的环境数据来识别人员,那么我们可以分析他并了解他是谁,如何正确与他交谈,最重要的是,以哪种语言跟他说话。

到目前为止,技术已经发展到可以分析一个人正在看的系列英雄了。 也就是说,您喜欢该系列-他们[喜欢]观看,观看,与之互动,以便了解哪个人适合您与他互动。 听起来完全是胡说八道,但是为了对某些资源感兴趣,请尝试一下-不同的人看到不同的创造力(以便正确地与之互动)。

没有任何一个现代媒体或任何视频资源可以向您显示任何新闻。 转到媒体-加载了大量算法,这些算法可以识别您,了解您以前的所有活动,对Matmodel产生吸引力,然后向您展示一些东西。 在这种情况下,这是一个奇怪的故事。

您如何定义需求? 心理测验 面相


有很多方法(实际)可以确定一个人的实际需求,以及如何正确地与他沟通。 有很多方法,每个人都以不同的方式做出决定,一个不能说有多好,有多坏。 看起来,基本的,每个人都知道。



心理测验 我认为,在接受了剑桥分析公司的报道后,她感到非常震惊,因为现在第二个政治公司都来了:“哦,你能像特朗普一样对我这样做吗? 我也想赢,等等。” 实际上,对于我们的现实,例如政治选举,这当然是胡说八道。 但是,使用三种模型来确定心理型:

  • 第一种是基于您所消费的内容-您所写的文字,您喜欢的某些信息,视频等。
  • 第二个因素与您如何与Web界面交互,如何键入,按住哪些按钮有关-实际上,整个公司都可以使用键盘笔迹可靠地确定现在所谓的心理型。
  • 我不是心理学家,我不太了解它是如何工作的,但是从广告传播的角度来看,划分为这些细分受众群的受众效果非常好,因为某人需要与蓝色女人一起显示红色屏幕,而某人需要一个黑暗的屏幕是带有某种抽象的蓝色背景,它的工作原理非常酷。 处于较低水平-如此之大,以至于一个人甚至都不会考虑它。 现在,广告市场的主要问题是什么? 所有这些都是特殊服务的代理,每个人都在躲藏,每个人都安装了十百万浏览器权限,因此无法以任何方式进行识别-您可能拥有Adblocks,Gostry和各种阻止跟踪的应用程序。 因此,很难理解某个人。 技术日趋发展-您不仅需要知道此人已经第125次返回您的站点,而且还知道他仍然是一个如此陌生的人。

面相学是一门很有争议的科学。 它甚至都不被认为是科学。 这是一群曾经为内政部的测谎仪编程的人,现在他们正像说的那样从事创意的拟人化工作。 这里的方法非常简单:从一些社交网络中获取一些公开照片,并使用它们来构建三维几何图形。 如果您是律师,现在您将说这是个人和个人资料; 我会告诉你,这些是位于太空中的30万个点,这不是一个人,也不是个人数据。 当Roskomnadzor来到他们身边时,每个人通常都会这样说。

但是认真地,单独地,如果您的名字和姓氏未在此处签名,则您的脸孔不是您的个人数据。 最重要的是,这些人标记出各种面部特征,这些面部特征会影响一个人做出决定的方式以及与他互动的方式。 在广告的某些部分效果不佳的某个地方; 在哪些细分中效果很好。 最后,事实证明,当您转到某个资源时,会看到不止一个横幅显示给所有人,但是,例如...现在,为不同的受众群体提供16或20个选项是正常的-而且效果非常好。 是的,从消费者的角度来看,这甚至更令人遗憾,因为人们开始越来越多地进行操纵。 但是,从业务角度来看,这非常有效。

黑匣子机器学习


这就提出了此类技术的以下问题:毕竟,对于大多数开发人员而言,现在所谓的深度学习就是一个“黑匣子”。 如果您曾经沉迷于这个故事并与开发人员交谈,他们总是会说:“哦,听着,好吧,我们在那里有些不可理解的东西,我们也不知道它是如何工作的。” 也许有人吃过。

这实际上与事实相去甚远。 现在所谓的机器学习远非黑匣子。 可以使用多种方法来描述输入和输出数据,最后,该公司可以根据机器决定向您显示该色情视频或其他视频的迹象来彻底理解该方法。 问题是,没有一家公司透露这一点,因为:首先,这是商业秘密; 其次,会有大量您甚至不知道的数据。

例如,在此之前,在有关道德的讨论中,我们讨论了社交网络如何分析个人消息以在某种广告故事中标记人物。 您向某人写东西-在此基础上,您实际上会获得某种广告通讯的标签。 而且您永远也不会证明它,并且证明它没有意义。 但是,如果揭示了这样的模型,那么它们将会出现。 事实证明,构建这样的推荐系统的市场假装不知道为什么会这样。

人们不想知道他们对他们的了解。


第二个故事是客户永远不想知道为什么收到这个特定的公告,这个特定的产品。 我会告诉你这样的故事。 我在基于此类算法的推荐系统的商业实现中的第一次经验是为了在2015年在庞大的性用品商店网络中进行研究(是的,这也不是一个好客的故事)。



向客户提供了以下内容:他们登录,使用其社交网络登录,在5秒钟内某个地方为他们提供了完全个性化的商店,也就是说,所有产品都已直接更改-它们属于某个类别,依此类推。 您知道这家商店的转化率提高了多少吗? 一点都不! 人们走进来,马上就用光了。 他们走进来,意识到他们正得到他们所想的...

该测试的问题在于,在每种产品下都写有他们为什么向您建议这样做的原因(“因为您属于隐藏群体”,有能力的女人正在寻找“破布”的男人)。 因此,现代的推荐系统从不显示做出“预测”的数据。

媒体是一个非常受欢迎的故事,因为它们都使用类似的推介系统。 以前,算法非常简单:请参阅“政治”类别-它们将向您显示“政治”类别的新闻。 现在,一切都变得如此复杂,以至于他们分析了停下鼠标的位置,您专注于哪些单词,复制​​了哪些内容以及如何与该页面进行交互。 然后,他分析了消息本身的词汇:是的,您不仅在阅读有关普京的新闻,而且还在某种程度上带有某种情感色彩。 当一个人收到一些消息时,他甚至都不会想起他是如何来到这里的。 但是,然后与该内容进行交互。

当然,所有这些都是为了让一个可怜的不幸男人对周围的大量信息感到疯狂。必须在这里说,使用这样的系统来个性化您周围的创造力,收集一些信息会很好,但是,不幸的是,到目前为止还没有这样的服务。

人工智能在起飞中抓住客户并形成需求


从一个推荐系统的创建到需求的形成,一个非常有趣的哲学问题出现了。很少有人考虑它,但是当您尝试询问条件Instagram时,“为什么要收集数据?为什么不向我展示一个绝对随机的广告?”,“ Instagram”会告诉您:“朋友,这一切都向您展示了您真正感兴趣的内容。”就像,我们绝对想认识您,以便向您确切显示您要寻找的内容。



但是,技术已经远远超越了这个可怕的里程碑,类似的技术也无法预测您的需求。他们(注意!)形成需求。在这种通信中,这可能是围绕人工智能的最糟糕的事情。可怕的是,在过去3-5年中,几乎所有地方都在使用它-从Google发行到Yandex发行,再到某些系统……好吧,我不会对Yandex不好说。很好

有什么意义?当您撰写“我想购买一个儿童座椅”时,您看到这样的广告传播策略已经很久了,您看到十亿份出版物。他们继续进行以下操作:只有一个女人张贴了一张几乎看不见的肚子的照片,她的丈夫会立即开始追寻消息-“男人,很快就分娩了。买一个婴儿座椅。”

在这里,您合理地问,为什么在如此巨大的技术进步下,我们仍然在社交网络上看到如此糟糕的广告?问题是,钱仍然可以解决这个市场上的所有问题,因此在某个好时机,一些广告商(例如“可口可乐”)可能会说:“这里有2000万用户-向整个互联网展示我的烂摊子”。他们确实做到了。

但是,如果您做出某种干净的表述并测试这种算法对您的猜测有多准确:它们首先尝试对您进行猜测,然后他们开始提前做一些事情。人脑以这样一种方式工作,即在接收到可靠信息后,它甚至不会处理收到该信息的那一刻。第一条规则是确定自己在做梦-您需要了解自己是如何来到这里的。一个人永远不会记得他在房间里的那一刻。这里是一样的

Google可能会开始塑造您的世界观


此类研究是由多家从事眼动追踪的外国公司进行的。他们将设备放在专用计算机上,以记录对象眼睛的位置。她招募了五千到七千名志愿者,他们只是滚动录音带,与社交网络互动,进行广告宣传,他们写下了这些人停止寻找横幅和广告素材的信息。

事实证明,当人们获得如此个性化的广告素材时,他们甚至都不会考虑它-他们立即过去,开始与之互动。从业务的角度来看,这很好,但是从我们作为用户的角度来看,这并不是一件很酷的事情,因为-他们害怕什么? -有条件的“谷歌”可以在某一时刻开始(当然甚至没有开始)以形成自己的世界观。例如,他明天可能会开始向人们展示地球是平坦的。

这是个玩笑,但是他们被选举的次数很多,他们在选举中开始向某些人提供某些信息。我们都习惯了这样一个事实,即搜索引擎可以诚实地获取所有信息。但是,就像我经常说的那样,如果您真的想知道世界如何运转,请编写自己的搜索引擎,无需过滤器,无需关注版权,也无需在列表中排名任何朋友。互联网上真实数据的发布通常不同于Google,Yandex,Bing等显示的内容。隐藏了一些资料,因为朋友,同事,敌人或其他人(或您与之共眠的前恋人)无关紧要。

特朗普如何获胜


当美国上一次大选时,进行了一项非常简单的研究。他们在不同的地方,来自不同的IP,来自不同的城市,不同的人用相同的谷歌搜索相同的请求。按照惯例,此请求的格式为:谁将赢得选举?令人惊讶的是,这样构造的结果是,在那些试图投票选错候选人的州中,他们收到了一些有关由Google提拔的候选人的好消息。哪一个好吧,很清楚-成为总统的人。这是一个绝对无法证明的故事,所有这些研究都需要您用手指指着水。 Google可能会说:“伙计们,所有这一切都是为了使我们为您显示最相关的内容。”

从现在开始,您应该知道最相关的不是无花果。公司出于某些好或坏的原因而将您需要出售的物品称为相关物品。

那些现在没有钱的人已经在为将来的购买做准备


仍然有一个有趣的时刻,我将谈论。现在,社交网络中有大量活跃的受众,他们的应用程序是年轻人。我们称其为-资不抵债的青年:单击moronic游戏的8-9岁儿童,这些儿童仅在社交网络上注册,年龄为12-13-14。大型公司为什么要花费大量预算和资源来为从未获利的破产客户创建应用程序?当受众变得有偿付能力的时候,将有足够的数据可以很好地预测其行为。



现在问任何目标学家最困难的听众是什么?他们会说:高利润。因为例如通过社交网络出售价值1.5亿卢布的公寓几乎是不可能的。在个别情况下,当您为1万人做某种广告时,一个人买了这套公寓-客户成功了。但是从统计的角度来看,十分之一是完全废话。那么,为什么很难确定高利润的受众呢?因为现在是高利润听众成员的人是在互联网还很小的时候出生的,所以当Artemy Lebedev仍然不知道时,也没有关于他们的信息。无法预测他们的行为模式,也无法理解领导者从他们接受的内容来源中为谁考虑的想法。

因此,当你们都在25年内成为亿万富翁时,要向您出售产品的公司将拥有大量数据。因此,欧洲现在出现了引人注目的GDPR,这阻止了未成年人的数据收集。

自然,这个无花果实际上不起作用,因为所有孩子仍然玩着母亲的,父亲的帐户-这样收集信息。下次给孩子平板电脑时,请考虑一下。

当每个人都死于机器战争中时,绝对不是一个可怕的反乌托邦式的未来-现在绝对是真实的故事。有大量的公司通过人们玩游戏的方式来创建对他们进行心理描述的算法。非常有趣的行业。在此基础上,人们被细分,以便他们可以以某种方式与他们交流。



这些人的行为预测将在10到15年内提供-正是在他们成为有偿力的受众的那一刻。最重要的是,这些人已经事先获得许可来处理他们的个人数据,将其传输给第三方,而这一切都是幸福,等等。

谁会失业?


我的最后一个故事是,每个人都总是问50年后会发生什么:我们都会死,行销商会失业……难道行销商担心失业,对吗?通常,担心是不值得的,因为任何高素质的人都不会失去工作。



无论创建了什么算法,无论汽车到达我们这里有多少(指向头部),如果它发展得足够快,这些人将永远不会闲着,因为有人必须使用这些创意去做。是的,有各种各样的“汉人”可以画出看起来像人的图画,创造音乐,但是仍然有一天,人们不太可能会失去在这一领域的工作。



我拥有历史的一切,因此如果您还有其他疑问,可以提出问题。谢谢啦



主持人: -朋友们,我们现在转到问题解答区。你举手-我来找你。



观众提问(H): -关于“黑匣子”的问题。他们说,您可以特别了解为什么要为这样的用户提供准确的结果。这些算法是某种算法,还是每次都需要解析的每个特殊模型(作者注:“为此而专门设计”-拉丁语用语单位)?还是已经准备好了,对于某些神经网络,您可以大致理解其业务含义?

AH:-在这里,您需要了解以下内容:在机器学习中,有很多任务。例如,有一个任务-回归。对于回归,根本不需要神经网络。那里的一切都很简单:您有几个指标,您需要计算以下内容。在某些任务中,有必要诉诸于深度学习。确实,在深度学习中,很难可靠地了解为哪些神经元设置了权重,但是从法律上讲,您需要做的就是了解输入中包含哪些数据,如何在输出中播放。这足以使此类决定获得专利,并且足以理解采用该故事的依据。

没有这样的事情,您去了网站,并且因为两个月前您用Instagram拍摄了红头发而被显示了某种横幅。如果开发人员没有收集此数据的收集,即该模型中头发的颜色标记,则不会从天花板上取下来。

如何出售机器学习系统的结果?


Z: -唯一的问题是:这是要了解如何解释,然后卖给不了解机器学习的人。我想说:我的模特-从头发的颜色明显地导致...那么,头发的颜色发生了变化...这可能吗?



AH: -也许是。但是从销售的角度来看,唯一的方案是可行的:您有一个广告活动,我们用机器形成的广告活动代替受众-您只看结果。不幸的是,这是唯一可靠的客户选项,可以说服这样的故事,因为市场上有很多解决方案曾经实施且无法使用。

关于创建虚拟身份


Z: -你好感谢您的演讲。问题是:由于某种原因而不想跟随机器学习的人,通过与界面的交互或出于其他原因,创建与自己的性格根本不同的虚拟性格的机会是什么?



AH: -有很多不同的插件专门用于行为随机化。有一件很酷的事情-Ghostery,在我看来,它几乎完全将您隐藏在一堆无法记录此信息的不同跟踪器中。但是实际上,现在对社交网络进行封闭的配置足以满足您的需求,因此没有人,没有邪恶的解析器在那里收集任何信息。最好添加某种扩展名或自己编写一些内容。

您会发现,这是一个概念,例如从法律上讲,个人数据是指可以用来识别您身份的数据,而法律举例说明了居住地的地址,年龄等。现在,可以用来识别您的数据不计其数:相同的键盘笔迹,相同的按键,浏览器的数字签名……或早或晚,此人会误解。他可以通过“ Tor”坐在“咖啡厅”中的某个位置,但最后,他要么忘记打开VPN,要么别的什么,然后就可以识别他了。因此,最简单的方法是创建一个关闭的帐户并安装某种扩展程序。

市场正在朝着这样的事实:您只需要按一个按钮即可获得结果


Z: -谢谢你的故事。一如既往,它总是很有趣(我跟着你)。问题是:在创建用户友好的推荐系统方面有什么进展?您说过,您曾经一次参与推荐系统,以寻找性伴侣,生活中的朋友(或一个人可能喜欢的音乐)……这一切有多大前景,以及从创造人们所需系统的角度来看,您如何看待它的发展?

AH:-总的来说,市场正在朝着人们需要按下一个按钮并立即获得他们所需要的事实的方向发展。至于我在创建约会应用程序方面的经验(顺便说一句,我们将在今年年底重新启动它),除了65%已婚的事实,最困难的推荐问题是在应用程序开始时向该人提供了几种模型-“友谊”,“性”,“性友谊”和“生意”。人们没有选择他们需要的东西。人们来选择“爱”,但实际上他们向所有人扔了裸体,依此类推。

问题是要确定一个不适合这些模型的人,然后以某种方式平稳地将他移到另一边。由于数据量少,很难确定这是预测算法错误还是人不在他的类别中。音乐也是如此:很少有真正有价值的算法可以很好地创作音乐。也许是Yandex音乐。有人认为Yandex.Music算法不好。例如,我喜欢她。例如,我个人不喜欢YouTube音乐算法等。

当然,它们有一些微妙之处-一切都与许可证相关...但是,实际上,对此类系统的需求非常大。一家从事推荐系统实施的Retail Rocket公司曾一度广为人知,但现在由于某种原因他们并没有长期开发自己的算法,因此它在某种程度上还不是很好。一切都到了这一点-我们进去了,而没有按任何键就得到了我们需要的东西(并且完全傻了,因为选择的能力已经完全从我们这里消失了)。

流感行销


Z: -你好 我叫康斯坦丁。 我想提出一个关于影响力营销的问题。 您是否知道允许企业根据一些统计信息为企业选择合适的博客的系统? 出于什么原因呢?



AH: -是的,我从头开始讲,所有这些技术的问题在于,营销中的所有人工智能都像走钢丝的人一样运动:左边有大公司,他们有很多钱,而且无论如何,它们都会有一切都有效地进行,因为他们的广告活动只是针对观看; 另一方面,有很多小型企业将无法使用,因为它们拥有大量数据。 到目前为止,这些故事的适用性还处于中等水平。

当已经有足够的预算并且任务是正确地处理这些预算(原则上,已经有很多数据)时……我知道一些服务,例如“ Getblogger”,似乎有算法。 老实说,我还没有研究这些算法。 我可以告诉您,当一些母亲需要送礼物时,我们会使用什么方法来寻找意见领袖。

我们使用一个称为“内容分发时间”的指标。 它的工作方式如下:您选择要分析其受众的人,并且需要系统地(例如,每5分钟一次)收集有关发布者,对其进行评论等的信息。 因此,将有可能理解来自观众的每个人在什么时间与其内容进行交互。 对听众的每个代表重复此操作,因此,例如,使用内容的平均分发时间的度量,可以将这些颜色撒在这些人的大型网络图中,并使用此度量来构建群集。

例如,如果我们希望找到15位对某位woman.ru持公众意见的母亲,这将非常有效。 但这是一个相当复杂的技术实现(尽管从理论上讲,完全可以在Python上实现)。 最重要的是,大型广告代理商的影响力营销问题在于,他们需要大型,酷炫,昂贵的博客作者,而这些博客作者都不该死。 好吧,汽车品牌希望通过某种意见领袖出售某种产品​​-他们首先需要使用汽车博客,因为这些受众群体的受众已经购买了汽车,或者确定知道要购买哪种汽车,只是看了很酷的汽车。 在此重要的是不要错过对本人听众的分析。

营销机器人


Z: -告诉我,社交网络上的机器人对信息收集及其质量有多大影响?



AH: -对于机器人来说,这很有趣。 廉价机器人很容易识别-它们具有相同的内容,或者彼此是朋友,或者它们位于一个网格中。 对于复杂的机器人,也有一些方法。 还是您正在询问一项任务,如何将一个人与假货联系起来?

Z: -所有这些垃圾将输出多少质量信息?

AH:在这里它是这样工作的:由于存在大量数据(例如,用于某种营销研究),因此您可以简单地排除所有这些麻烦。 也就是说,比起捕获机器人,多扔一些真实的人更好,因为对他们来说,展示各种广告是没有用的。 但是,如果您收集度量标准,例如与横幅或推荐系统的交互,则可能会丢弃此类帐户。

当前,社交网络上有六个虚拟角色,或者仅仅是左页或内向的人,这些算法可以像机器人一样“匹配”。 至于将人与假货联系起来,这里的所有内容都与一个人迟早会犯错这一事实有关,而事实是行为模型是相同的-他的真实账户是假货。 他们迟早会观看相同的内容或其他内容。

归根结底,这不只是错误的百分比,还在于可靠识别一个人所需的时间。 对于住在他的Instagram上的人来说,这个可靠的身份识别时间降为5分钟。 对于某人-六到八个月。

向谁以及如何出售数据?


Z: -你好 我想知道公司之间如何销售数据? 例如,我有一个应用程序,您可以在其中找到(向开发人员)一个人去哪里,存储什么以及他在那花了多少钱。 而且,我想知道如何将这些商店的受众群体信息出售给这些商店,或者将其数据放入一个庞大的数据库中并为此付费呢?



AH: -至于直接向某人出售数据-其余所有这些都被OFD所淘汰-财政数据运营商,他们在支票转让和税收之间巧妙地建立了联系,现在正试图将所有东西出售给所有人。 实际上,实际上,它们已经使整个移动分析市场崩溃了。 实际上,您可以嵌入您的应用程序,例如Facebook像素,其DMP系统。 然后利用此受众群体进行销售。 例如,像素“可能目标”。 我不仅仅知道您有什么样的听众,还需要了解。 但是无论如何,您都可以集成到最大的DMP系统Yandex或My Target中。

这是一个相当有趣的故事。 唯一的问题是,您将所有流量都交给了他们,然后他们将这些流量的货币化作为交换。 他们可能会告诉您有10个人使用了您的受众群体,也可能没有。 因此,您可以建立自己的广告网络,或者投降到大型DMP。

谁会赢-艺术家还是技术员?


Z: -一个离技术部分有点远的问题。 据说市场人士担心即将到来的大规模失业。 创意营销(那些想出鸡广告,大众广告的人)和那些处理大日期的人(说:我们只是收集所有数据并向每个人投放目标广告)之间存在某种竞争。 )? 作为直接参与的人,您的意见是什么,谁会赢?艺术家,技术员,还是会产生某种协同效应?



AH: -听着,他们一起工作。 工程师不会创造创造力。 那些有创造力的人不会吸引观众。 有一个多学科的故事。 实际上,现在那些坐着并按下按钮的人有问题,那些制造“诱饵”的人每天都按下相同的东西-这样的人将会消失。

但是那些分析数据的人自然会保留下来,但是必须要处理这些数据。 有人将不得不拿出这些图片,然后绘制它们。 这样的创意机器将无法提出! 这是完全的疯狂! 或像病毒广告Carprice这样的广告,效果很好。 请记住,这是在YouTube上发布的:“在Carprais出售”,她绝对疯了。 当然,没有神经网络会产生这样的故事。
我通常支持这样一个事实,不是人们会失去工作,但他们会有更多的自由时间,他们将有空闲时间用于自我教育。

原始广告将消亡


Z: -总的来说,在同一位置显示的广告,横幅-甚至是销售文字都没有写在那里:“我们需要窗户-拿走它!”,“您需要其他东西-拿走它!”,也就是说,根本没有创意。

AH: -这样的广告迟早会消失。 它之死不是因为技术的发展,而是因为你我的发展。

相关最好与无关


Z: -我在这里! 我有一个关于实验的问题,正如您所说,您没有成功(使用推荐系统)。 在您看来,问题在于该签名已在此处签名,为什么被推荐,或者用户看到的所有内容都与他有关? 因为我读过一个针对妈妈的实验,并且那里没有太多数据,并且互联网上也没有太多数据,所以只有食品零售商的数据-预测怀孕(他们将成为妈妈)。 当他们向准妈妈展示精选产品时,准妈妈惊恐地发现,他们在做些正式事情之前就已经了解了它们。 而且它没有用。 为了解决这个问题,他们故意将相关商品与完全不相关的商品混合在一起。



AH: -我们根据提出的建议特别向人们展示了他们的反馈意见。 实际上,从这里诞生的概念是,人们不必说这些对他来说是某种超级相关的商品。

是的,顺便说一句,有一种方法可以将它们与不相关的对象混合使用。 但是,情况恰恰相反:有时人们会进来,并且他们与这种无关紧要的产品进行交互-会获得随机排放,模型会崩溃,而且一切都会变得更加复杂。 但这确实是。 此外,许多公司特别是如果知道某人正在处理他们的数据(某人可以从他们那里窃取这样的结果),则有时会对其进行特殊混合以证明以后您没有从中获取数据。其推荐系统,但来自有条件的Yandex.Market。

广告拦截器和浏览器安全


Z: -你好 您提到了Ghostery和Adblock。 您能告诉我这样的追踪器通常是如何有效的(也许根据统计数字)? 您是否收到公司的订单:他们说,请确保Adblock无法关闭我们的广告。

AH: -我们不会直接与广告平台联系-只是因为他们没有要求确保每个人都看到他们的广告。 我个人使用Ghostery-我认为这是一个很棒的扩展。 现在,所有浏览器都在为隐私而战:Mozilla发布了许多更新,Google Chrome现在具有超级安全性。 它们都会阻止一切可能的事情。 Safari默认已禁用陀螺仪。
当然,这种趋势是好的(不是对那些收集数据的人,尽管他们也从中受益),因为人们首先会阻止cookie。 拥有广告网络的每个人都记得浏览器指纹之类的奇妙技术-这些算法可接收60个不同的参数(屏幕分辨率,版本,安装的字体),并根据这些参数计算出唯一的“标识符”。 我们切换到这个。 浏览器开始为此苦苦挣扎。 总的来说,这将是泰坦无休止的战斗。

最新开发的“ Mozilla”得到了很好的保护。 她几乎不保存任何cookie,设置了很短的使用寿命。 特别是如果您启用隐身模式,将根本找不到您。 问题是,在所有服务中输入密码都是不方便的。

心理分型和相貌在哪里工作,什么地方不工作?


Z: -亚瑟,非常感谢您的演讲。 我也很高兴地关注您在“ YouTube”上的演讲。 您提到营销人员越来越多地使用心理定型,相貌。 我的问题是:它在哪些类别的品牌中起作用? 我相信它仅适用于快速消费品。 例如,选择一辆汽车就是...

AH: -我可以下载它的确切位置。 它适用于各种故事,例如Amediateki,电视节目,电影等。 如果不是高端市场,而是各种各样的学生证,分期付款,那么这在银行和银行产品中效果很好。 在所有快速消费品中,它在FMCG和各种“ iPhone”,充电器中都非常有效。 它在“妈妈的”商品,“父亲的”商品中效果很好。 尽管我知道在钓鱼中(有这样一个话题)……好几次有渔民的案件-他们永远无法可靠地分割。 我不知道为什么 某种统计错误。

这对于驾车者,珠宝首饰以及一些用于家庭的物品而言效果不佳。 实际上,这与人们在社交网络上从来没有写过的东西不太兼容-您可以通过这种方式查看。 有条件地购买洗衣机:这是如何了解谁拥有洗衣机,谁没有洗衣机的方法? 似乎每个人都拥有它。 您可以使用CRF数据-通过支票查看谁买了东西,通过支票“领取”这些人。 但是实际上,例如在Instagram上您从未听说过的这类事情,很难使用。

机器将技巧视为统计抛出。


Z: -我对定位有疑问。 是否有可能(或突然存在)有条件的随机角色,在所有事情上都与自己矛盾:一开始他先搜索“最佳体育馆”,然后搜索“十种无所事事”? 一切都如此。 定位可以遵循与自身矛盾的定位吗?

AH: -唯一的问题是:如果您使用Google两年了,您告诉了他所有关于自己的信息,现在安装了一个插件,该插件将编写类似的随机查询,那么根据统计数据,您当然可以会明白-您现在正在做的是一个统计上的异常值,整个过程就是清除掉。 如果您愿意-注册一个新帐户,但广告数量不会改变。 她只会变得怪异。 虽然她现在很奇怪。


一点广告:)


感谢您与我们在一起。 你喜欢我们的文章吗? 想看更多有趣的资料吗? 通过下订单或向您的朋友推荐给开发人员的基于云的VPS, 最低 价格为4.99美元这是我们为您发明的入门级服务器独特类似物: 关于VPS(KVM)E5-2697 v3(6核)的全部真相10GB DDR4 480GB SSD 1Gbps从$ 19还是如何划分服务器? (RAID1和RAID10提供选件,最多24个内核和最大40GB DDR4)。

阿姆斯特丹的Equinix Tier IV数据中心的戴尔R730xd便宜2倍吗? 只有我们有2台Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100电视在荷兰起价199美元 戴尔R420-2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB-$ 99起! 阅读有关如何构建基础架构大厦的信息。 使用价格为9000欧元的Dell R730xd E5-2650 v4服务器的上等课程?

Source: https://habr.com/ru/post/zh-CN482816/


All Articles