如何基于语义的聚类和词义化开发在线商店结构

如何基于语义的聚类和词义化开发在线商店结构

在为现有的在线商店选择语义之后,一个不愉快的空缺等待着您:商店的结构很可能不允许您放置所有关键短语。 我们将不得不推迟优化直到更好的时机(当您开始重新设计时),或者将新页面压缩到现有结构中,从而使其混乱和复杂化。


如果折衷解决方案不适合您,请使结构适应新的语义。


但是如何设计分区/小节,以便一方面包含来自内核的数千个键,另一方面又改善导航呢? 我们举一个例子。



源数据


以年轻的区域性在线商店(例如家居装饰,纪念品和礼物)为例。


如何基于语义的聚类和词义化开发在线商店结构

当前结构如下:


如何基于语义的聚类和词义化开发在线商店结构

对于在线商店,收集了1000个短语的语义核心,并从“垃圾”和“假人”(基于产品名称和商店类别形成)中清除了该语义。


如何基于语义的聚类和词义化开发在线商店结构

任务是开发一种新的商店结构,以反映用户的实际搜索需求。 我们将分三个阶段解决它。



阶段1.聚类


聚类是根据关键词搜索结果的相似性对关键词进行分组。


与基于语义相似性的分组不同,集群避免了与将具有不同意图的请求放置在同一页面上相关的错误。


例如,基于语义分组时的短语“为卧室购买图片”和“为卧室购买图片”可能会归为一组。 但是,如果您查看它们的搜索结果,结果将有所不同。


如何基于语义的聚类和词义化开发在线商店结构

所有这些都是因为短语“卧室的绘画”具有商业意图(用户选择产品),而短语“卧室的绘画要购买”具有交易意图(用户选择了绘画并准备购买)。 因此,第一个短语的发布包含一张照片,一些想法和一个包含商品的页面,第二个短语仅包含在线商店的页面。


对于群集,有在线服务(Just Magic,PixelPlus, PromoPult等)和桌面程序(KeyAssort,KeyCollector)。 它们的工作原理类似(除非在KeyCollector中进行集群需要进行特定的准备):加载查询列表,指定区域,集群的准确性并获得分组的核心。


聚类时,设置正确的精度(在词组归为一组的TOP-10中结果的匹配数)尤为重要。 例如,如果准确性为3,则在发出三个或三个以上相同结果的情况下,查询将属于一个集群。


如果精度低,则群集过于广泛;如果精度高,则核心可能过于分散。


为了不猜测和不为不必要的迭代多付钱,最方便的是设置一个范围的精度。 在这种情况下,您将获得几个集群核心,但只需支付一次。 PromoPult集群中有这样的功能。 我们将精度设置为3到7,设置优先级搜索系统,区域并开始该过程:


如何基于语义的聚类和词义化开发在线商店结构

下载报告并以不同的准确性比较聚类的结果。 我们的任务是选择“黄金均值”,以使集群不会过于庞大和分散。 在我们的示例中,精度6被视为最佳。


如何基于语义的聚类和词义化开发在线商店结构

集群之后,我们遇到一个问题:在线商店的现有结构不允许放置请求组。


例如,存在“木制烛台”和“在线商店中购买蜡烛”的集群。 我们无法将这些群集放在一页上-它们具有不同的意图。 但是在网站上,具有此类名称的产品组仅位于一页上,这从优化角度来看是不正确的。


如何基于语义的聚类和词义化开发在线商店结构

逻辑建议:为什么不仅仅创建“蜡烛”部分并针对“购买蜡烛”集群对其进行优化,然后将“烛台,烛台,蜡烛”部分重命名为“烛台”并针对“木制烛台”进行优化?


但这不是那么简单:如何处理其他集群,例如“烛台作为礼物”? 要放置在“烛台”部分中? 还是“假期”? 还是更多? 大约有200个这样的集群-每个集群都有其自身的“问题”。


第二阶段。集群的词法化和引理的分类


为了形成商店的结构,有必要根据共同特征对集群进行分类并对其进行分组。 词法化将在这里有所帮助-将原始短语分解为单独的单词,并将它们带到主格的单数形式(引理)。


复制群集的名称(而不是键!),将其粘贴到lemmatizer中并开始该过程。


如何基于语义的聚类和词义化开发在线商店结构


如何基于语义的聚类和词义化开发在线商店结构

我们将单词从“合法化单词”部分传输到Excel,并为每个单词分配一个分类属性。


如何基于语义的聚类和词义化开发在线商店结构

符号简要地描述了被去词化的单词。 例如,单词“购买”可以描述为一个过程。 因此,相反,我们将符号标记为“过程”。 您可以使用其他名称(例如“动作”)。 这并不重要-关键是将所有单词按相似的符号分组。


在我们的案例中,有九个迹象:


  • 时间(“三月”,“年”,“二月”);
  • 地点(“家”,“商店”等);
  • 场合(“出生”,“婚礼”等);
  • 主题(“礼物”,“装饰”等);
  • 流程(“购买”,“刺绣”);
  • 财产(“人工”,“墙”等);
  • 样式(“样式”,“普罗旺斯”,“阁楼”,“破旧”);
  • 货物(“图片”,“花”等);
  • 人(“男朋友”,“女友”等)。

我们根据属性对引理列表进行排序,并将数据传输到列中以方便可视化。


如何基于语义的聚类和词义化开发在线商店结构

尚未完成的结构。 但是我们已经到了终点。


阶段3.在线商店结构的形成


我们分析每个特征的引理,并考虑为哪些特征创建节/小节或过滤器。


如何基于语义的聚类和词义化开发在线商店结构

符号“时间”被立即消除。 这里有与“场合”有关的词。 我们也删除了“过程”这一标语,因为“刺绣商”一词无关紧要,并且“购买”将出现在商店的几乎所有页面上。


在“产品”的基础上最多的话。 由于我们拥有在线商店,因此将所有产品移至单独的菜单项是很有意义的。 我们称其为“目录”。


在“位置”的基础上创建菜单项也是合乎逻辑的。 我们称其为“装饰类型”。 子项目-“用于客厅”,“用于厨房”,“用于花园”等。


同样,我们在菜单中标记“场合”。 将该项目称为“假期”。 小节将为“新年装饰”,“生日装饰”等。


根据“人”属性,我们将创建“礼物”菜单项,其中包含“男朋友礼物”,“朋友礼物”,“祖母礼物”等小节。


最后一个菜单项是“样式”,它是基于相同名称的属性形成的。 子项目-“普罗旺斯装饰”,“破旧别致装饰”,“阁楼装饰”。


仍然存在“主体”和“财产”的标志。 基于第一个符号,突出显示菜单项或过滤器没有任何意义,我们将在不同部分的名称中使用它们。 但是基于属性“ properties”中的单词,我们进行过滤:


  • 颜色(必填-黑色,白色,红色,绿色+其他颜色);
  • 材料(木材,铁,青铜,瓷器,玻璃,石英,乙烯基);
  • 位置(地板,墙壁,桌子,悬挂式装饰);
  • 形状(圆形,椭圆形,正方形,不规则形状);
  • 大小(高,小,大);
  • 其他特征(发光,浪漫,雕刻,芳香)。

构建商店的结构:


如何基于语义的聚类和词义化开发在线商店结构

仍然需要按节和小节对搜索查询的簇进行排序。


如何基于语义的聚类和词义化开发在线商店结构

自然,将没有足够的部分和子部分来散布所有200个群集。 在其余群集下,将创建具有过滤结果的页面(例如,将存在页面“ White Decor”,“ Round Decor”,“ Romantic Decor”等)。 如果此后仍保留集群,则会为其优化相关产品卡。


该方法可以轻松扩展到任何项目。


得益于语义的聚类和词义化,您可以轻松地按搜索意图对短语进行分组,并基于这些短语形成一个在线商店结构,其中要考虑目标受众的真实兴趣。


该方法的优点是可伸缩性。 它适用于具有数万个密钥的小型平台和在线商店。 而且,在大型项目中,当无法进行手动直观的工作时,该方法最能体现自己。

Source: https://habr.com/ru/post/zh-CN458410/


All Articles