Yandex在过去一年中如何改变了搜索。 仙女座更新

Korolev上次重大更新以来已经一年多了。 该版本中包含的想法在此期间得到了进一步的发展,并找到了新的应用程序。 在《仙女座》更新中,我们着重于搜索引擎的那些方面,这些方面使我们的用户可以快速便捷地解决尽可能多的任务。


今天,我们传统上将向Habr读者介绍我们已完成的工作。



总体而言,此更新包括一千多种不同的改进。 对于一个简短的故事,我们将它们分为三个大块:


  • 快速解答 。 这里是收集的实现,使您可以直接从带有搜索结果的页面获取答案,而不必访问任何第三方站点。
  • 选择的便利 。 当用户需要从外部站点接收信息时,有必要为他的选择过程提供便利,并增加转换有用的可能性。
  • 集合 。 在Internet上的Yandex服务上可以找到您,需要将其轻松保存到收藏夹中以备将来使用。

搜索质量的工作不仅与特定方案的功能实现有关。 还有必要不断研究衡量产品对用户有用性的指标的质量。


在过去的一年中,当用户仅需要检查带有搜索结果的页面来解决其问题时,我们就学会了更好的理解-例如,通过明确阅读其问题的答案; 此外,我们学会了区分搜索中的“有用”过渡和没有结果的过渡。


现在,我们的用户每天成功完成比去年冬天一百五十万次搜索任务。 搜索问题的解决方案可以是到站点的有用转换,也可以是与搜索结果页面的某种交互。


1.快速回复


Yandex的优势一直是,仍然可以从搜索结果中快速获得答案,而无需访问任何站点。 在过去的一年中,我们可以从搜索结果页面( 例如 )接收到即时响应的请求数量增加了超过一半半,因此,现在我们的用户每天使用的答案超过1300万次。


但是,现在快速的答案不仅仅是文本或表格。 我们为大量新场景添加了快速且交互式的答案。


例如,这里是查询“ 附近的咖啡厅 ”的快速答案。




可以更详细地研究每个组织:访问地址,照片,评论,出勤信息等。 所有这些都可以完成,而无需离开搜索结果!


对于其他类型的组织,现在可以看到类似的答案。 假设您可以查看萨马拉酒店罗斯托夫健身房的列表。


极大地发展了我们对体育咨询的回应。 现在,对于大多数足球锦标赛来说,都可以提供一个漂亮的答案,包括时间表,排名,最新消息,在某些情况下还可以链接到直播,比赛记录和有趣时刻的重播。




顺便说一下,有关Yandex搜索的大量新的快速答案是度量标准发展的直接结果,这是我在本文开头提到的。 以前,当搜索质量主要与用户点击次数相关时,很难想象这样的答案。 现在,我们可以测量每个元素包含多少有用信息,以及用户实际使用它的频率。


使用户更容易获得答案的另一个功能是与组织的对话。 如果Internet上对该问题没有答案,或者很难找到答案,则可以直接向支持此机会的网站所有者询问。 搜索中的相关文档带有“与公司聊天”按钮。



最后,在某些情况下,可能需要建议或讨论,而不是特定的简短答案。 对于这种情况,我们创建了Yandex.Creatives服务。 在服务中,您可以提出问题并从各个专业领域的专家那里得到答案-医生,培训师,厨师,设计师,律师。 现在,Yandex.Znatokov的答案已与Search集成在一起,因此您通常可以在结果页面上直接查看它们:



该服务使您可以响应任何用户,当然,您可能想知道应该信任哪种意见。 因此,我们可以访问每个用户的所有答案:您可以了解他回答的主题,他的评价是什么,并最终形成自己的见解。


2.易于选择


在开发搜索算法时,我们始终关注用户访问的那些网站的质量。 但是,以前的搜索版本主要着眼于对特定请求的响应,因此,网站的整体质量在选择文档时起着次要的作用。


在新版本的Search中,这种影响已大大提高:ceteris paribus,我们更喜欢提供优质服务的网站,即使这些网站与特定请求的上下文隔离也是如此。


更具体地说,我们学习了如何自动识别网站的几个重要特征,并在排名时将它们考虑在内:


  • 方便
  • 永久的忠实观众;
  • 有用和侵入性信息的平衡;
  • 与其他搜索结果成对比较的网站索引。

问题是,排名时考虑的特征对用户不可见。 为了解决这个问题,我们为站点引入了特殊标志 。 现在,我们使用三种类型的此类标志。


第一个符号是蓝色标签,类似于社交网络上已验证帐户的标签。 这些标志是在Yandex.Directory的组织官方网站上,Avto.ru的官方经销商网站,俄罗斯联邦中央银行的金融组织网站,Yandex服务上获得的; 它们也可以显示为导航答案,以及实际上是在社交网络上已确认的个人资料。


第二个标志是“受欢迎的站点”。 拥有大量忠实观众的热门网站收到了这样的标志。


第三个符号是“用户选择”。 即使忠诚度很高并且经常返回该站点,利基站点也可以在受众较少的情况下获得此标记。


我们检查了搜索结果页面上是否存在字符,以帮助用户导航并快速找到所需的结果。 我们的一位参与发布的产品经理帮助我们说明了它们的用处。 他一直在寻找有关敏捷认证的信息,当然,有很多站点都提供有关此主题的相关信息。


但是,在搜索结果中,还有habr.com上的一篇文章,作者在其中描述了他通过培训的经验。 这篇文章是与此要求最相关的答案,这一事实与事实相去甚远,因此它不一定排在第一位。 但与此同时,标牌告诉用户这是该站点的结果,这对将来的用户非常有用。




选择的另一个重要方面是反馈。 在过去的一年中,我们能够极大地增加收集的评论和评分的数量:现在,用户每天与Yandex分享其印象的次数超过15万次。


没有强大的机器学习技术,就不可能进行良好的工作评估。 我们会在审查中积极打击任何欺诈和垃圾邮件的表现。 算法的速度在这里非常重要:很明显,如果延迟一天处理数据,那么不道德的用户可能有时间留下大量有害评论,而其他用户将有时间查看它们,然后我们才能采取任何措施。 因此,对我们来说,最大的实现之一就是能够处理数据并在几分钟之内将其纳入我们模型中的能力。 这意味着对Yandex的评论和评分几乎总是处于良好状态。


当然,就像Yandex.Connectors一样,对于用户来说,了解他们阅读的评论很重要。 我们不会透露作者的性格,但允许我们了解他们的所有评论。 因此,您可以更好地了解特定作者,了解您的口味是否相似,然后做出自己的选择。



3.馆藏


我们的搜索服务(例如Yandex.PicturesYandex.Video或实际上是大型搜索)使您可以在Internet上快速找到所需的信息。


但是通常仅查找信息是不够的,您想要将其保存以备后用-例如,过一段时间后,返回您感兴趣的站点,保存图片或视频剪辑,然后有一天与您的朋友共享。 到目前为止,还没有一种解决方案可以方便,统一地存储各种类型的信息。


为了解决这个问题,我们更新了Yandex.Collections服务。 收藏集可让您保存各种类型的信息:图片,视频,网站,甚至电影,系列和书籍。 集合与我们的搜索服务紧密相关:在Yandex.Pictures和Yandex.Video中实现了添加到集合的功能:请注意“添加到集合”按钮。 同样,此类按钮可用于大型搜索中的对象。



Yandex应用程序中,您可以将在“搜索”中找到的网站添加到集合中。 很快,所有平台上的所有Yandex搜索用户都可以使用此功能。


因此,用户可以在Yandex搜索服务上创建其集合。 创建收藏集后,将提供建议:例如,与收集的收藏集中的图片风格相似的图片。 为此,我们的技术用于查找相似的图像并确保多样性发挥最大作用。 我们想推荐相似但不相同的对象。


通过研究建议,您可以进一步了解感兴趣的主题。 假设我仅用三张卡片就收集了一组精美的内饰。 之后,我可以从其他用户集合中获得大量建议,这当然大大简化了对最终令我感兴趣的选项的搜索。



可以将集合设为私有,这样就没有人可以访问它们,甚至不知道它们的存在。 您可以在那里保密。 另一方面,您可以打开集合,然后对所有Yandex用户可用:在Yandex.Collection服务和大型Search中。




该示例完美地说明了搜索将如何使用诸如Experts和Collections之类的服务。 用户解决他们的任务,创建可供所有用户使用的新对象,并帮助他们更快地解决他们的任务。 因此,现代搜索不仅允许在现有数据数组中查找信息,而且还可以创建对其他人有用的新信息。




我们可以清楚地看到我们的工作结果如何影响搜索份额。 自上次发布以来,Yandex在移动设备上的搜索份额已增长了6个百分点以上,这显然不是限制。




当然,我们将继续开发此处列出的领域,并继续有目的地提高搜索的所有表现形式的质量,改进我们的机器学习方法和质量指标。

Source: https://habr.com/ru/post/zh-CN430264/


All Articles