在线商店的媒体广告有效性模型

People&Screens作为广告合作伙伴,多年来一直与在线业务合作。 当我们有一个想法来评估展示广告对在线商店销售的贡献时,这似乎是无法实现的,甚至是疯狂的。 一旦我们意识到可以找到马赛克的所有元素并将它们放在一起,我们决定尝试一下。 我们首先与Data Insight一起确认了第一个假设,然后我们深入研究了这个故事,并在几个月的艰苦工作中创建了这样的研究,该研究实际上是一种实用的工作工具-一种评估12种电子商务产品类别广告效果的模型。 在本文中,我们将讨论结果和使用的分析方法。

图片

研究目的与结果


我们研究的关键假设是:展示广告,发展在线商店的品牌,提高整个销售渠道的转化率。 在过去四年的销售数据,广告和外部数据分析中,这一假设得到了证实。 因此,我们为12种产品类别的60家在线商店建立了计量经济学的销售模型。

  1. 仅展示广告的短期贡献就占在线商店增长的39%,平均市场动态为50-60%。

    图片
  2. 展示广告可让您通过增加知识来支持销售。

    图片
  3. 整个电子商务中最大的回报来自在线视频广告。

    图片
  4. 媒体效率在很大程度上取决于类别:在服装和在线大型超市类别中,电视在电子产品和汽车产品中均显示较高的效率-在线视频广告。

我们分析了什么


参与研究的两家公司都进行了研究数据的收集。 “人员与筛选”收集了以下数据:

  1. 展示广告退出。 我们使用了从Mediascope数据库下载的所有广告组都可以访问的内容。 从2016年1月开始,我们按天(针对电视,广播,新闻,互联网广告)和按月(针对户外广告)详细地向广泛的目标受众(所有18岁以上)分发所有媒体和广告联系人的广告费用。直至2019年6月。 为了在此阶段最大化工作速度,我们使用了Dentsu Aegis Network Russia的内部开发来处理工业数据,尤其是Atomizer平台。
  2. 最近18个月每天都从SameWeb卸载数据。 我们查看了基于桌面/移动设备访问天数的动态,基于源(渠道)桌面流量天数的动态以及Android上安装的动态。
  3. TGI /市场营销指数数据库2016-2019季度知识/访问/购买动态。 这是从Mediascope的Gallileo工业软件下载的。
  4. 2016年1月至2019年7月整个俄罗斯的Google趋势搜索查询。

在“数据洞察”方面,收集并提供了以下数据:

  1. 从2016年1月到2019年8月,每月排名前100位的72家在线商店的订单动态。
  2. 对于TOP-11网站, li.ru计数器数据为2018年1月至2019年8月的期间(流量统计,分别是在俄罗斯境内的总计,仅在移动市场内)。
  3. 2017年6月至2019年9月期间53个站点的mail.ru计数器数据。
  4. 2017年6月至2019年9月期间38个站点的漫步者计数器数据。
  5. Yandex Wordstat从2017年10月到2019年9月的24个月的搜索查询数据
  6. 截至2018年,对TOP-100在线商店的平均支票进行评估。

数据算法


该研究的数据收集分多个阶段进行。 我们将不在本文讨论范围之内,而是Data Insight的同事为生成研究所需的数据而进行的工作,但是我们将告诉您在“人员和屏幕”方面所做的工作:

  • 从可用的工业数据库中的TOP-100评级中搜索所有在线商店,并编制名称匹配字典。 为此,我们使用了Elasticsearch语义搜索引擎
  • 模板的形成并在其上上传数据。 在此阶段,最重要的是预先考虑数据表的体系结构。
  • 将所有来源的数据组合到一个数据集(数据集)中。
    为此,我们使用了pandassqlalchemy软件包在Python中处理上传的数据。 这里的生活技巧很标准:
    在处理大于一百万行的csv表中的原始数据时,我们首先使用查询形式上传表列名称:

    col_names = pd.read_csv(FILE_PATH,sep=';', nrows=0).columns 

    然后通过字典添加数据类型:

     types_dict = {'Cost RUB' : int } types_dict.update({col: str for col in col_names if col not in types_dict}) 

    和数据本身加载功能

     pd.read_csv(FILE_PATH, sep=';', usecols=col_names, dtype=types_dict, chunksize=chunksize) 

    转换结果已上载到PostgreSQL。
  • 基于对“ People&Screens”代理商的客户群中的流量动态,搜索查询和实际销售额的分析,对订单动态进行交叉验证。 在这里,我们使用df.corr()在固定站点内的不同数据集上建立了相关矩阵,然后详细分析了带有异常值的“可疑”系列。 这是研究的关键阶段之一,在该阶段我们检查了所研究指标动态的可靠性。
  • 在经过验证的数据上构建计量经济学模型。 在这里,我们使用了numpy包( np.fft.fftnp.fft.ifft函数 )的直接傅立叶逆变换和逆傅里叶变换来提取季节性,分段平滑逼近以估计趋势以及sklearn包的线性回归模型( linear_model )来估算广告的贡献。 在为该任务选择一类模型时,我们从以下事实出发:应轻松解释模拟结果,并考虑到数据质量,将其用于数值评估广告的有效性。 我们通过将数据分为可变时间间隔的训练样本和测试样本来研究模型的可靠性。 即 我们比较了从2016年1月到2018年12月的数据训练的模型在测试时间间隔(从2019年1月到2019年8月)中的行为,然后在从2016年1月到2019年1月的时间间隔训练了模型,并研究了从2月到2007年1月的数据在模型中的行为2019年8月。通过不同训练样本中广告因素贡献的稳定性作为测试样本的预测来研究模型的质量
  • 最后一步是根据调查结果准备演示文稿。 在这里,我们为实际业务结论建立了数学模型的桥梁,并从结果的常识角度再次测试了模型。

电子商务分析的细节以及过程中出现的困难


  1. 在数据收集阶段,正确评估资源中的搜索兴趣会出现困难。 在Google趋势中,无法像Yandex Wordstat一样对搜索查询进行分组并使用否定关键字。 研究每个在线商店的语义核心并上传中心请求非常重要。 例如,M.Video需要用俄语编写-这是此网站的主要要求。

    对于在线和离线销售商品的商店,Data Insight的同事在Yandex wordstat数据中采用了以下方法:
    确保没有不相关的问题(主要不是要估计需求量,而是要跟踪动态变化)。 我们足以过滤搜索词。 如果品牌名称存在风险,可能会收到不适当的请求,那么我们会对组合键进行统计。 例如,用“臭氧商店”代替“臭氧”-通过这种方法,零售商的搜索受欢迎程度被低估了,但是需求动态得到了更可靠的衡量,并消除了“噪音”。 关于搜索统计信息,存在一个方法论问题,显然没有可靠的解决方案-对于许多零售商而言,这些统计信息会被SEO工具所扭曲,这些SEO工具会通过行为因素优化搜索结果,但会扭曲实际需求的统计信息。
  2. 在合并来自不同来源的数据的阶段,有必要将数据统一到一个粒度:电视广告和SameWeb的流量数据是每天的数据,搜索查询的数据是数周的数据,订单和电表数据的数据是数月的数据。 结果,我们形成了一个单独的数据库,其中包含日期字段,可让您按要求的级别汇总数据;还有一个缓存的每月汇总数据库,可用于进一步处理销售数据的所有详细信息。
  3. 在数据的交叉验证阶段,我们发现自己的数据在销售动态方面存在明显差异。 这需要与Data Insight的同事讨论情况。 结果,由于对最大错误发生月份的准确了解,分析师确定了两个错误,这些错误深处在评估每月销售动态的算法的底部。
  4. 在模型开发阶段,出现了一些困难。 为了正确评估广告的效果,有必要隔离外部因素。 任何销售动态(电子商务也不例外)不仅与广告相关,而且还与许多其他因素相关:网站上的UX / UI更改,价格,分类,竞争,货币波动等。
    为了解决此问题,我们使用了基于长期数据回归分析的方法-从2016年1月到2019年8月。 作为此方法的一部分,我们分析了可归因于此期间广告的订单动态变化(激增)。

重要的是要理解,如果某个广告在某个时候开始了,但是根据模型,销售的预期价值不高于实际的价值,则该模型将显示该广告在此期间不起作用。 当然,这种销售行为可能是多个因素的叠加(例如,在广告活动开始的同时,价格上涨/竞争对手的推出或网站因顾客涌入而“下跌”)。

由于我们在很长一段时间内对多个品牌的效果进行平均,因此,这种随机巧合的效果应在大量样本中予以消除,尽管这可能会导致单个品牌的效果被高估或低估。 结果,这使我们能够确定整个电子商务类别的一般规则和模式。 同时,为了详细分析各个品牌内广告的影响,仍然有必要研究整个影响因素。

结论


作为这项研究的一部分,我们设定了自己的目标,即基于来自不同来源的数据获得最可靠的结果。 这些数据本身并不是精确值,而只是通过第三方监视(监视广告输出,流量动态,搜索兴趣以及最终订单)来评估这些值。

每个链接在数据质量上都有局限性,这是分析师和研究人员每天或多或少面临的一个问题。 我们希望,在本文的框架内,我们能够证明哪些方法可以确保分析研究结论的可靠性,同时又能保留结果的解释力。

Source: https://habr.com/ru/post/zh-CN479960/


All Articles