AntipovSN和MihhaCF
UPD第二部分
UPD第三部分
第一部分(伯爵尚未成为阿陀斯人)没有遇到米拉迪,他一切都很好
作者简介:
下午好 今天,我们开始发表一系列有关计分和在其中使用图论的文章(TG)。 我希望我们有足够的保险丝,力量和耐心,因为 这个话题非常多,而且我们认为很有趣。
尽管有漫画名称,但我们将尽量不涉及已经影响到我们许多人生活的漫画主题,并且在不久的将来可以毫无例外地影响所有人。
所有漫画寓言,插入内容等都旨在略微减轻叙事的影响,并且不允许其陷入乏味的演讲中。 我们向所有不喜欢我们幽默的人致歉
现在到了重点。
本文的目的:在不超过30分钟的时间内,向读者介绍研究问题,确定问题的考虑程度,描述研究的基本概念并介绍基本术语。
术语和定义:
- 计分是一种基于数值统计方法的对象点评估系统。
- 图是一种建模对象关系的方式。 想象一下,您正在和朋友一起玩扑克,并且想模拟谁现在欠谁。 例如,“ D'Artagnan欠Athos 10 louis”

完整的图形可能如下所示:

阿拉米斯总是很狡猾……在他的脑海里,甚至连阿索斯都欠他。 Porthos直到遇到Koknar夫人为止,买不起敷料,并设法欠D'artanyan乞be,尽管坦率地说,他们一生都被肢解了……
图由节点和边组成。 一个节点可以直接连接到其他几个节点。 这些节点称为邻居。
- 加权图是将权重分配给每个边的图。 没有权重的图称为未加权。
- 有向图或有向图是为其边缘分配方向的图
- 有向无环图是有向图的一种情况,其中没有有向循环,即,路径在同一顶点处开始和结束。
- 数据挖掘是一个统称,用于表示一组方法,用于检测在人类活动的各个领域中做出决定所必需的数据中知识的先前未知,非平凡,实际有用和可访问的解释。
- 广度优先搜索算法(BFS,广度优先搜索)回答了两个问题:从节点A到节点B的路径是否存在以及从节点A到节点B的最短路径是什么。旁路按级别执行:检查一级节点,他们的子节点被添加到队列中,依此类推直到最后
- 深度优先搜索(DFS)算法-一种深度搜索策略是尽可能深入图。 递归地描述搜索算法:我们对来自所讨论顶点的所有边进行排序。 如果边缘导致先前未考虑的顶点,则我们从该未经检查的顶点运行算法,然后返回并继续对边缘进行排序。 如果考虑的顶点中没有导致未检查顶点的边,则会发生返回。 如果在算法完成后未考虑所有顶点,则有必要从未检查的顶点之一运行算法
- Dijkstra的算法 -查找从图的一个顶点到所有其他顶点的最短路径。 该算法仅适用于具有加权边且无负权重的非循环图。
好吧,通过最基本的概念,您可以更接近这一点。
评分可用于评估几乎所有内容,这些都可以用统计指标表示。 这是对个人/法人的信誉的评估(对申请人的评分),对欺诈可能性的评估(对欺诈的评分),对被保险人的评估(保险评分),对供应商/客户的评估(对对手方的评分),对消费者行为的评估(行为评分),社会评估(“中文”评分)等
反过来,图论也是一种通用工具,可用于需要处理大量多层次数据的任何活动领域。
这两个工具是相互创建的,例如D'artanyan和Constance( 您只需正常遵循Constance而不放任Miladya就可以了 )。
我们不会写任何关于评分的重要性和时事性的内容,因为足以仔细研究一下,并且很明显我们已经很长时间没有明确地进行评分了,这只会变得更加有趣。
在系列文章中,我们将尝试使用图论来清楚地说明评分如何在银行业中发挥作用。 也就是说,我们将根据法人实体提供的数据以及它们与其他组织的关系(即所谓的“借款人评分” )来确定法人实体(甚至可能钩住物理学家)的信誉度。
根据官方定义,对借款人进行评分的目的是消除借款人决策的主观性,减少内部欺诈的程度并提高贷款决策的速度。 让我们看看是否是这样,可以展开糖果,可以这么说,然后看看它是由什么制成的。
并非偶然地选择了银行业-银行拥有广泛的信息资源,并且越来越多地使用自动化进行评分。
稍微接近一点。 还记得达达尼昂与德萨萨克先生的战斗吗? 在那走一步,在这里走一步,然后我们绕着树跑,然后才开始互相刺伤。 我们不会那样拉,但立即刺伤也没有意义-尚不清楚。
这样啊 在战斗系统中,将基于两组指标计算得分球:
- 直接从借款人和国家获得的指标。 器官:
- 税务报告;
- 所有者的护照详细信息,基因。 董事 会计师
- 统一国家法律实体登记表,EGRIP;
- 所有权文件;
- 债务数据;
- 法院数据;
- 依此类推
- 使用图分析和数据挖掘获得的指标:
- 与国家互动。 机构-连续/分包/供应;
- 与前100名公司的互动;
- 破产公司,债务人,得分较低的公司在借款人的环境中;
- 参加慈善组织
- 依此类推
根据列出的指标,将建立一个模型:图的顶点将是借款人以一种或另一种方式进行交互的所有组织,图的边缘将具有权重。 连接的权重将设置在1到5的范围内,这表示节点之间的影响程度。
例如:
- 借款人(在这种情况下是供应商)受与客户的合同约束,金额为100万卢布。 借款人的年营业额为500万卢布,客户的年营业额为1亿卢布。 可以清楚地看出,供应商对客户的依赖性要大于对供应商的依赖性。 因此,对于供应商而言,连接将为5(例如),对于客户而言,连接为1。
显然,该示例纯粹是推测性的,在现实生活中,我们将进行更详细的分析。 这是以下文章的内容,而现在深入了解这些内容是没有意义的。
相互作用的程度以及相互作用本身将尤其使用图搜索算法来确定。
在我们的测试系统中,我们将对火枪手及其连接使用相同的主题。 该模型将尽可能接近战斗并充分展示我们的想法。 我们最终会得出什么结果,模型将是什么样? 花点时间说:“加拿大!” 或“我不需要学院。 童年时代的任何Gascon都是院士!” 一切都不会像看起来那样原始。

简短说明:我们的火枪手决定创建一家非公开股份公司(NPAO),该公司将提供珠宝并提供安全服务,他们需要贷款才能开始活动。 信用机构是PJSC Korol,它委托NPO One for All进行评估
呈现图的特征:
- 该图是非定向的 (双向的)和加权的。
- 每个肋骨都有一个权重-相互作用的程度。 在图中,我们没有使节点之间的各个方向的连接值复杂化。 我们将自己限制在一个汇总的沟通评估中。 但是在计算算法中将对此加以考虑。
- 带有红色标记的组织反对我们,并以各种方式对其进行干预。 在现实生活中,将是竞争对手,破产公司,恶意违约者,正在进行诉讼的公司等。
- 可能您已经可以猜测,您将需要按级别和方向评估关系,即,您不仅需要考虑沟通水平,还需要考虑方向。 有必要考虑节点之间的相互影响等等。
我们还有很多工作要做。 好吧,作为本文的一部分,我们已经完成。 在我们看来,本文所述的目标已经实现。 希望我们能引起您的兴趣,并请您仔细阅读。