成功秘诀中最重要的要素是知道如何与人相处。 西奥多·罗斯福在上一篇文章中,我尝试介绍了定价分析的基础知识。 现在,我想谈谈更有趣的事情。
您是否曾经想过为什么要在商店中选择某些产品,为什么比其他类似产品更喜欢它们? 许多购物旅行都是自发的,因此不可能在每次购物时都给出明确的答案。 但是总体思路很明显:您出于特定原因而去购物(买食物,小玩意,娱乐,玩二十一点)。 在本文中,我将使用杂货店零售商的可用数据来讨论一组基本的逻辑假设和社区分析如何帮助我们确定客户选择产品的方式。
引言
当涉及到有关零售的经典故事时,我不禁要考虑长期以来使用收据分析的推荐系统。 就像有关Target优惠券,啤酒和尿布的著名故事一样。

这些案例使用鲜为人知的市场篮分析(MBA)或亲和力分析方法。 主要思想是开发一套看起来像“当他们购买
X时 ,他们通常会购买
Y ”的规则,然后将其用于进一步的操作(个人推荐,视觉销售等)中。这些规则用于确定补码,即相互补充的商品。 这种方法非常流行,因为它易于实现和解释结果。 问题在于,除了补品之外,并不总是很清楚如何使用您发现的数据以及我们如何定义替代商品。 让我们尝试改进这种方法:我们可以根据客户需求对产品进行分组,然后找出消费者如何做出购买决定。
使MBA更加复杂,确定替代品
让我们将MBA方法变得更加复杂,并研究许多零售商发行的会员卡中的信息(对于在线商店,您可以使用客户ID)。 我们可以对会员卡而不是收据进行MBA分析(使用卡ID /客户ID而不是收据号)。 这将为我们提供与客户相关的产品对,即如果客户购买
X ,他们也购买
Y。 关键是他们在不同时间去商店时可能会购买
Y。让我们考虑一下如何确定替代产品。 我们可以做出一个合理的假设,即人们不会倾向于一起购买替代商品(我假设您不会经常同时购买150和300盎司的洗衣粉)。 在整个分析中,这是最重要的假设,对于杂货/家庭用品零售商以及其他零售商而言,在进行一些调整后,效果很好。 这一假设使我们得出以下结论:如果客户经常购买两种特定产品,但是在一张收据中很少能找到这两种产品,那么它们很可能是替代产品。 这是一个非常严肃的主张,需要事先对对进行定性分析-我们需要消除统计上不相关的对,删除“香蕉”等。 对于其余的连接,我们可以引入
W度量,该度量反映在一张会员卡中购买产品的频率比在一张收据中购买产品的频率高。
最终,我们将获得具有“
W连接”度量标准的成对产品,它们看起来像“产品
X和
Y很少出现在一张收据中,而是经常被同一个人购买”。 连接指标越高,我们对这些产品可以替代的信心就越大。
从MBA到SNA
下一步合乎逻辑的步骤是将所有成对的商品视为一个整体。 我们可以将每对表示为具有
W值的图的边。 如果我们创建所有连接的可视化表示,它将看起来像这样:

在这里,我们可以清楚地看到具有紧密联系的产品组。 让我们应用SNA(社交网络分析)算法并查看结果。 我以Louvain方法为例。 我们应该以替代产品组结束。 让我们看一下潜在的结果:
•DANONE ACTIVIA樱桃2.9%150克
•DANONE ACTIVIA草莓2.4%150克
•DANONE ACTIVIA蓝莓2.9%150克
•DANONE ACTIVIA麦片2.4%150克
•DANONE ACTIVIA纤维和谷类食品2.9%150克结果看起来很有希望-这些产品确实看起来可以满足顾客对DANONE酸奶的需求。 分析中确定的所有产品组均符合对替代商品的直观感知。 当然,有一些不那么明显的例子,部分是由于品牌,零售商将其分配给不同的组,但是从消费者的角度来看,它们仍然满足相同的需求:
•Lux面部保湿霜,适合干性皮肤
•Yantar面部保湿霜,适合中性至干性皮肤
•Nevskaya Kosmetika胡萝卜面部保湿霜,适合干燥敏感的皮肤
•Nevskaya Kosmetika黄瓜面部保湿霜,适合油性和混合性皮肤
•Nevskaya Kosmetika橄榄保湿面霜,适合干性和正常皮肤
•Nevskaya Kosmetika人参眼霜现在,对于层次结构
Louvain方法可用于创建产品组的层次结构。 简单来说,让我们构建不同大小的产品组,将它们变成一棵树(客户决策树)并查看结果:

是的 我们的树可以很容易地从业务逻辑和直觉两方面进行解释-消费者知道他们想要炼乳,然后在罐头和包装袋之间选择,选择价格,就可以买了。 现在我们知道人们使用什么标准来满足他们对炼乳的需求-包装的类型和价格。 在此特定示例中,选择不是由品牌或人们经常可以归因于产品的其他任何因素决定的。
好树,下一步是什么
该树可帮助我们确定影响最终选择的客户需求(树的较低级别)和产品特征(根据树的层次结构)。 结果可以应用于零售的不同领域:
- 理想情况下,至少一种产品应满足每种需求。 因此,连锁店中的每个商店都应有满足客户需求的商品。 与其拥有20罐炼乳,不如拥有10罐和10个背包。
- 在一个客户需求内,产品的同类化率最高。 现在,我们仅限于可以计算价格和需求预测的交叉影响的一组产品。
- 这棵树有助于视觉营销(或在线放置产品)
- 对于个人建议,它是经典MBA的补充,有助于形成交叉销售优惠
综上所述:我们使经典MBA稍微复杂了一些,并取得了可用于不同零售业务的结果。 这是一项非常有趣的任务-我不得不运用逻辑思维,分析数据和聚类图。
希望您喜欢! 优化流程,聚类图,优化数据存储(因为垃圾回收,垃圾回收)并获得惊人的结果。