AntipovSN y MihhaCF
UPD parte dos aquí
UPD parte tres aquí
La primera parte, en la que el Conde aún no se ha convertido en Athos, no ha conocido a Milady y todo está bien con él.
Introducción de los autores:
Buenas tardes Hoy estamos comenzando una serie de artículos dedicados a la puntuación y al uso de la teoría de grafos en ella (T.G.). Espero que tengamos suficiente fusible, fuerza y paciencia, porque El tema es bastante voluminoso y, en nuestra opinión, interesante.
A pesar del nombre cómico, trataremos de tocar temas que no sean cómicos y que ya afectan la vida de muchos de nosotros, y en el futuro cercano pueden afectar a todos, sin excepción.
Todas las alegorías cómicas, inserciones, etc. están diseñadas para aliviar ligeramente la narrativa y no permitir que caiga en una tediosa conferencia. Pedimos disculpas a todos los que no entienden nuestro humor
Ahora al grano.
El propósito de este artículo: en no más de 30 minutos, presentar al lector el problema de investigación, determinar el nivel de consideración del problema, describir el concepto básico del estudio e introducir términos básicos.
Términos y definiciones:
- La puntuación es un sistema de evaluación puntual de un objeto basado en métodos estadísticos numéricos.
- Un gráfico es una forma de modelar relaciones entre objetos. Imagina que estás jugando póker con tus amigos y quieres simular quién le debe a quién ahora. Por ejemplo, "D'Artagnan le debe Athos 10 louis"

Un gráfico completo podría verse así:

Aramis siempre fue astuto ... en su mente, incluso Athos se lo debía. Porthos, hasta que conoció a Madame Koknar, no podía darse el lujo de comprar un vendaje y logró deberle un mendigo a D'artanyan, aunque, francamente, mutilaron algo todo el tiempo juntos ...
Los gráficos consisten en nodos y aristas. Un nodo se puede conectar directamente a varios otros nodos. Estos nodos se llaman vecinos.
- Un gráfico ponderado es un gráfico con un peso asignado a cada borde. Un gráfico sin pesos se llama no ponderado.
- Un gráfico dirigido o dirigido es un gráfico cuyos bordes tienen asignada una dirección.
- Un gráfico acíclico dirigido es un caso de un gráfico dirigido en el que no hay ciclos dirigidos, es decir, caminos que comienzan y terminan en el mismo vértice.
- Data Mining es un nombre colectivo utilizado para denotar un conjunto de métodos para detectar interpretaciones de conocimiento previamente desconocidas, no triviales, prácticamente útiles y accesibles en los datos necesarios para tomar decisiones en diversos campos de la actividad humana.
- El algoritmo de búsqueda de amplitud (BFS, Breadth-First Search) responde a dos preguntas: ¿existe la ruta desde el nodo A al nodo B y cuál es la ruta más corta desde el nodo A al nodo B. El bypass se realiza por niveles: los nodos de primer nivel se verifican, sus nodos secundarios se agregan a la cola, y así sucesivamente hasta el final
- Algoritmo de búsqueda de profundidad primero (DFS): una estrategia de búsqueda profunda es profundizar en el gráfico lo más posible. El algoritmo de búsqueda se describe de forma recursiva: clasificamos todos los bordes que provienen del vértice en cuestión. Si el borde conduce a un vértice que no se consideró anteriormente, ejecutamos el algoritmo desde este vértice no examinado, y luego regresamos y seguimos clasificando los bordes. El retorno ocurre si no hay bordes en el vértice en consideración que conducen al vértice no examinado. Si después de completar el algoritmo no se consideraron todos los vértices, entonces es necesario ejecutar el algoritmo desde uno de los vértices no examinados
- Algoritmo de Dijkstra : encuentra los caminos más cortos desde uno de los vértices del gráfico hasta todos los demás. El algoritmo solo funciona para gráficos acíclicos con bordes ponderados, sin peso negativo.
Bueno, más o menos, con los conceptos más básicos resueltos, puedes acercarte al punto.
La puntuación se puede utilizar para evaluar casi cualquier cosa, que se puede expresar en indicadores estadísticos. Esta es una evaluación de la solvencia de una persona / entidad jurídica (calificación del solicitante), y una evaluación de la probabilidad de fraude (calificación del fraude), y una evaluación del titular de la póliza (calificación del seguro), una evaluación del proveedor / cliente (calificación de la contraparte), evaluación del comportamiento del consumidor (calificación conductual), evaluación social (Puntuación "china"), etc.
La teoría de gráficos, a su vez, también es una herramienta universal que se puede utilizar en cualquier campo de actividad en el que sea necesario procesar grandes volúmenes de datos de varios niveles.
Estas dos herramientas se crean una para la otra, como D'artanyan y Constance ( solo tienes que seguir a Constance normalmente y no dejar ir a ninguna Miladya ).
No escribiremos nada sobre la importancia y la actualidad de la puntuación, ya que es suficiente mirar más de cerca e inmediatamente se hará evidente que hemos estado explícitamente o no explícitamente durante mucho tiempo, entonces solo será más divertido.
En la serie de artículos, intentaremos demostrar claramente cómo funciona la puntuación utilizando la teoría de gráficos en el sector bancario. Es decir, determinaremos la solvencia de las entidades jurídicas (tal vez incluso enganchemos a los físicos) en función de los datos que proporcionen y las relaciones que tengan con otras organizaciones, la denominada "calificación del prestatario" .
Como se desprende de la definición oficial, la calificación del prestatario está diseñada para eliminar la subjetividad de la decisión del inspector de crédito, reducir el nivel de fraude interno y aumentar la velocidad de toma de decisiones sobre el préstamo. Veamos si es así, expanda los dulces, por así decirlo, y veamos de qué está hecho.
El sector bancario no se eligió por casualidad: los bancos tienen amplias fuentes de información y los puntajes se realizan utilizando la automatización, cada vez más activamente.
Un poco más cerca del punto. ¿Recuerdas cómo D'artagnan peleó con el Sr. de Jussac? Un paso allí, un paso aquí, luego corrimos alrededor del árbol y solo entonces comenzamos a apuñalarnos. No tiraremos así, pero tampoco tiene sentido apuñalar de inmediato, no estará claro.
Entonces! En un sistema de combate, una bola de puntuación se calculará en función de dos grupos de indicadores:
- Indicadores obtenidos directamente del prestatario y del estado. órganos:
- declaración de impuestos;
- Datos del pasaporte de los propietarios, gen. directores, cap. contador
- Declaraciones del Registro Estatal Unificado de Entidades Legales, EGRIP;
- documentos de título;
- datos de la deuda;
- datos judiciales;
- y así sucesivamente
- Indicadores obtenidos mediante análisis gráfico y minería de datos:
- interacción con el estado. cuerpos - en una fila / subcontrato / suministro;
- interacción con empresas de las 100 mejores;
- la presencia en el entorno del prestatario de empresas en quiebra, deudores, empresas con una puntuación baja;
- participación en organizaciones de caridad
- y así sucesivamente
Sobre la base de los indicadores enumerados, se construirá un modelo: los vértices del gráfico serán todas las organizaciones con las cuales el prestatario interactuó de una forma u otra, los bordes del gráfico tendrán peso. El peso de la conexión se establecerá en el rango de 1 a 5, caracterizando el grado de influencia de los nodos entre sí.
Por ejemplo:
- El prestatario, que, en este caso, es el proveedor, está obligado por contratos con el Cliente por 1 millón de rublos. La facturación anual del prestatario es de 5 millones y la facturación anual del cliente es de 100 millones de rublos. Se ve claramente que el Proveedor depende del Cliente más que el Cliente del proveedor. Por lo tanto, para el Proveedor, la conexión será 5 (por ejemplo) y para el Cliente 1.
Está claro que el ejemplo es puramente especulativo y en la vida real haremos un análisis más detallado. Este es un asunto de los siguientes artículos, y ahora no tiene sentido profundizar tanto.
El grado de interacción y las interacciones mismas se determinarán, entre otras cosas, utilizando algoritmos de búsqueda de gráficos.
En nuestro sistema de prueba, usaremos el mismo tema con los mosqueteros y sus conexiones. El modelo estará lo más cerca posible del combate y demostrará suficientemente nuestra idea. ¿A qué llegaremos en última instancia, cómo se verá el modelo? Tómese su tiempo para decir: "¡Canalia!" o "No necesito academias". ¡Cualquier gascón de la infancia es un académico! Todo no será tan primitivo como parece.

Breve descripción: nuestros mosqueteros decidieron crear una sociedad anónima no pública (NPAO), que suministrará joyas y servicios de seguridad, necesitan un préstamo para comenzar la actividad. La entidad de crédito es PJSC Korol, que encargó la evaluación de NPO One for All
Características del gráfico presentado:
- El gráfico no está orientado (bidireccional) y está ponderado.
- Cada costilla tiene un peso: el grado de interacción. En la figura, no complicamos y hacemos nuestro valor de conexión en cada dirección de nodo a nodo. Nos limitamos a una única evaluación de comunicación agregada. Pero en el algoritmo de cálculo esto se tendrá en cuenta.
- Organizaciones marcadas en rojo que se oponen a la nuestra y que interfieren en todos los sentidos. En la vida real, serán competidores, compañías en bancarrota, morosos, compañías contra las cuales el litigio está en curso, etc.
- Probablemente, ya puede adivinar que necesitará evaluar las relaciones por niveles y direcciones, es decir, deberá tener en cuenta no solo el nivel de comunicación, sino también la dirección. Será necesario tener en cuenta la influencia mutua de los nodos y mucho más.
Tenemos mucho trabajo por delante. Bueno, como parte de este artículo, hemos terminado. Los objetivos declarados del artículo, como nos parece, se han logrado. Esperamos haber logrado interesarle y lea hasta el final.