
成功的最重要公式是知道如何与人相处。 西奥多·罗斯福
在上一篇文章中,我尝试过讨论定价分析的基础知识。 现在让我们谈谈更有趣的事情。
您是否想过为什么要在商店购买某些产品,如何在众多类似产品中选择? 很可能,对所有可能的商店旅行的明确答案都行不通,其中许多是自发的。 但是总体思路很明显-当您去商店时,您正试图满足您的现有需求(食物,小玩意,娱乐,二十一点)。 在本文中,以食品零售商为例,我将讲述我的经验,即如何通过使用一些基本的逻辑假设和图表中的社区分析来确定客户如何选择产品。
引言
在经典的零售故事中,人们立即回想起长期使用客户支票数据分析的推荐系统故事。 例如,关于塔吉特(Target)和带尿布的啤酒的著名故事。

这些案例基于狭义的方法,即市场篮分析(MBA)或关联规则分析。 该方法的主要思想是构建一组规则,形式为“当他们购买X时,他们通常购买Y”,并将其用于进一步的流程(个人推荐,计算等)。 这些规则使您可以定义相互补充的商品补充 。 由于易于实施且结果具有良好的可解释性,因此该方法非常受欢迎。 主要问题在于,并非总是很清楚如何应用规则以及除补语之外如何确定替代物 。 让我们尝试稍微改进一下这种方法:根据客户的需求对产品进行分组,并了解买方如何做出购买决定。
我们使MBA复杂化,我们正在寻找替代产品
让我们稍微复杂化MBA方法,并考虑许多俄罗斯零售商拥有的会员卡上的其他信息(在线使用,您可以使用客户ID)。 我们将不在支票数据级别上而是在卡级别上进行MBA (即,我们将使用卡ID /客户ID代替支票ID)。 结果,我们获得了在客户级别彼此相关的成对商品,即 如果客户购买了产品X,那么他也购买了产品Y,并且这里的关键是可以在另一次访问商店的过程中购买产品Y。
让我们考虑一下如何定义替代产品。 我们做出一个逻辑上的假设,即一个人通常不会一口气购买替代商品(您很少同时购买3公斤和5公斤洗衣粉)。 这是整个分析中最重要的假设,它适用于杂货零售/家庭用品,并且对其他类型的零售商进行了较小的调整。 从这个假设出发,我们可以得出结论:如果客户经常购买一对商品,但在一张支票中很少发现,则可以很有信心地说它们是替代品。 该声明非常有力,需要对链接进行初步的定性分析-有必要删除统计上无关紧要的链接,删除“ 香蕉 ”等。对于其余链接,您可以输入W度量标准,该度量标准反映了在一张会员卡中购买商品的频率比在一张支票中的购买频率。
结果,我们形成了一对商品,形式为“商品X和Y很少被一张支票取走,而经常被同一个人取走”,并且具有某种通信度量W。 这种沟通措施越大,可以考虑使用更多的产品替代品。
有一个MBA,成为了SNA
下一步的逻辑步骤是不查看单个商品对,而是查看所有可用的商品对。 即 每对产品都可以表示为权重为W的图形的边缘。如果以图形方式描述结果连接,则会得到以下内容:

从图中可以清楚地看到彼此紧密联系的商品“社区”。 让我们应用社交网络分析(SNA )搜索算法并查看结果。 例如,使用Luvain算法。 结果应该是一组替代产品。 我们来看一个结果示例:
- DANONE ACTIVIA樱桃2.9%150g
- DANONE ACTIVIA草莓2.4%150g
- DANONE ACTIVIA蓝莓2.9%150g
- DANONE ACTIVIA牛奶什锦早餐2.4%150g
- DANONE ACTIVIA麸皮和谷物2.9%150g
结果看起来很乐观,这些产品与替代产品非常相似,并且可以满足DANONE酸奶的需求。 所有收到的商品组与替代产品的直觉理解都非常吻合。 当然,有一些不明显的例子表明零售商与不同的群体相关,尤其是由于品牌,但是从购买者的角度来看,它们仍然满足一个需求:
- 面霜豪华的面部,适合干性皮肤
- 琥珀色乳霜,适合干性和正常皮肤
- Neva化妆品胡萝卜面霜,适合干性和敏感性皮肤
- Neva化妆品黄瓜面霜适合油性和混合性皮肤
- Neva化妆品橄榄面霜适合干燥和正常皮肤
- Neva化妆品眼睛周围的人参面霜
现在,层次结构
Luvain算法允许您构建社区层次结构。 以简化的形式-让我们建立不同规模的社区,将它们扩展为一棵树( 客户决策树,客户决策树 )并查看结果示例:

万岁! 从业务逻辑和直觉的角度来看,生成的树得到了完美的解释-一个人决定要炼乳,然后在银行和包裹之间进行选择,然后选择准备购买商品的价格。 现在,我们了解了一个人通过什么特征来满足对炼乳的需求-包装类型和价格段。 在此特定示例中,没有人们经常喜欢归因于产品的品牌情感和其他事物。
这棵树很漂亮,接下来该怎么办
生成的树使您可以确定客户的需求(树的较低级别)以及影响选择的商品特性(根据树的层次结构)。 您可以将结果应用于零售的各个领域:
- 理想情况下,必须至少有一种产品能够满足每种需求。 即 连锁店中的每个商店都应拥有满足客户需求的产品。 即 最好有10个铁罐和10个袋子,而不是20个铁罐炼乳。
- 在一种需求的框架内,商品之间会相互蚕食。 即 现在,我们仅限于一组产品,在其中可以计算定价和预测需求的交叉影响。
- 这棵树有助于在架子上放置货物(或现场的货物订购)
- 在个人推荐中补充了经典MBA的交叉销售优惠
结果,我们稍微简化了经典MBA分析,我们得到的结果可立即用于零售商的各种流程中。 这项任务很有趣,您需要进行逻辑思考,分析数据和聚类图。
我希望这很有趣! 优化流程,聚类图,优化数据存储(因为Garbage In-Garbage Out)并获得出色的结果。