熟人或约会是永恒的,它们将始终以各种形式存在:在大街上,在互联网上,在网站上或在移动应用程序内部。 人们总是渴望与某人见面,每个人都会为自己选择最方便的方式。 一些人继续在酒吧,咖啡馆,街上结识,另一些人使用现代技术并在网上结识。 每个人都有自己的选择,我们不会评判任何一方,但进一步的讨论将是关于网上约会。
约会应用范例如果您没有涉及该细分市场中的大量欺诈,骗子,垃圾邮件发送者,那么实际上在站点或移动应用程序中,人们正在寻找一对,并且希望彼此之间的利益是共同的。 实际上,所有不符合此标准的事物在一方面都是浪费时间。 从呈现信息的角度来看,最成熟的方法是“传单”,其中显示一个个人资料,并且观看者必须决定他是否喜欢(喜欢,不喜欢)。 如果您喜欢调查表,则将通知她,并且如果彼此有共同的兴趣,则可以开始对话。 在不同的应用程序和不同的位置可能会偏离此方案,但是一般的操作原理应该清楚。
Facebook于多年前推出了Like,结果证明它是一种非常强大的激励和便捷工具。 他允许不进行对话就表现出对某人的兴趣,并且根据自己的反应,不等待答案,而是继续搜索。 如果有反应,对话就可以开始,但是它的价值比不考虑对等的简单分散的“问候”要高得多。
是的,喜欢帮助,并且也使用相互同情,但尽管如此,在约会市场上,过去15年间变化不大,这对于IT行业也很奇怪,在线约会也在不断发展。
实际上,这是什么问题?
根据统计,平均而言,每100不喜欢的人有17个喜欢。 也就是说,一个人所做的无用工作多于有用的工作,并且会收到他不感兴趣的内容。 这是考虑到了结果的当前过滤参数(按城市,年龄,兴趣和配置文件中指定的其他特征进行搜索)。 事实证明,此人对调查表的主要动作与对调查表所有者填写的关于自己的文本信息的了解无关,而仅与所呈现的照片(尤其是整个人或某人)的感知有关。 当形成相互同情时,将在下一步进一步评估对手。
喜欢,不喜欢-有什么问题?最终目标是减少用户无用动作的数量,并以比当前阶段更好的质量日期选择配置文件。 我们拥有足够大的基础来建立统计数据,分析和检验假设,以及用于训练和使用神经网络,我们制定并检验了以下两个假设:
- 但是,如果所有人都相似,并且通过在选择配置文件时分析相似人的结果,您可以改善并影响此样本的质量吗?
- 照片的神经网络能否根据以前的经验预测我们的偏好?
约会中的神经网络下面,我们将以约会领域中来自一个移动应用程序的数据为例,对实验进行更详细的描述。 感谢那些同意进行此类实验,分析和引入新技术的同事。 当然,所做的所有更改和进行的实验均绝不违反有关个人数据和GDPR的联邦法律。
解决方案1.如果所有人都一样怎么办?
假设和假设如下:如果一个人喜欢某人,并考虑了基本的搜索过滤条件,例如城市,年龄范围和性别,那么另一个喜欢同一人的人的结果(选择)将更可能适合第一个并考虑重复假设并增加人数,样本质量将会提高。
该假设的扩展是通过性别和城市来最小化传入的过滤参数,并且不仅要考虑具有相似偏好的正在寻找的人的外向喜欢,而且还要考虑他们喜欢的配置文件对他们的响应。
假设检验。 过滤器中仅指定性别和城市。 最初的抽样结果令人反感:
- 前四个不喜欢的个人资料
- 前两次喜欢喜欢的个人资料
- 另一个不喜欢
- 然后在第四次迭代中,根据指定的标准获得5个合适的配置文件的样本
基于该实验,展示了基于其他人的意见自动生成搜索查询的过程,在此基础上形成了活跃参与者的可能偏好。
作为此方案的扩展,可以考虑计算不喜欢和喜欢的次数,以澄清人物的画像以及年龄和落入样本中的个人资料的其他特征。
测试假设时使用的算法设置:

选项2。让我们学习神经网络为我们做出决定
假设和假设如下:也许照片中的人物在选择人物方面比一般的背景,位置,配件,拍摄质量和其他因素扮演更重要的角色。 为了检验假设,使用了Intel OpenVINO上的检测器,该检测器具有100万张照片。 这些结果是从用户的一般照片中获得的,这些用户的头像带有并行的喜欢数据库(谁喜欢谁以及这些喜欢的人是谁)。 检测器的结果以及将面部关键点强加在原始图像上的结果:

此外,在学习过程中,各种变化的照片对在训练过程中被传输到神经网络:
- 第一张照片(个人资料)像第二张照片
- 第一张照片(个人资料)类似于第二张照片,第二张照片
- 第一张照片(个人资料)不喜欢第二张,第二张照片不喜欢第一张
下面显示了基于数据库的喜欢进行比较时的训练样本。 以照片形式的两个输入,仅当从第一个到第二个有输入喜欢,相互喜欢或没有相互喜欢时(对于经过顺序训练的三个不同的网络)才传输到网络。
结果是三个神经网络,在给定的概率下,它们可以确定照片中人物的相容性。 与第一个选项相比,此选项的优点是可以在照片中快速搜索首选项,并且在SQL查询级别上的查询和相关性最少。 换句话说,最终的解决方案在推理过程中具有很高的生产率,并且具有很高的速度,较低的消耗和资源需求(不要与学习过程相混淆,在学习过程中,需要计算系统的最高性能,并且需要许多GPU参与其中)。
结论
我们已经实施了这两种选择,并且在当前阶段我们正在收集有关其有效性的统计信息。 奇怪的是,这两种方案都可以正常工作,并且可以极大地改善发行结果,从而减少用户的无用操作数量。 该业务的最终结果是增加了用户参与度,增加了共同点赞总数,并因此增加了购买付费帐户的次数。
现在,这两种解决方案的测试操作阶段都在进行中,并且有选择地向用户提供了算法,但是,如果您想根据个人资料真实地测试第一或第二种假设,请在应用程序中注册并通过电子邮件dushin@combox.io与我们联系,以字母表示您在应用程序中的登录信息,授予访问权限。