🧓 🧖🏽 🔧 R, Monte Carlo y tareas empresariales 🏂🏽 🚥 🎦

Al resolver problemas prácticos con envidiable regularidad, uno tiene que enfrentar dos enfoques típicos que se presentan en las reuniones o están en el aire.

Opción 1: resolvamos un problema particular de manera general. Habiéndolo resuelto de esta manera, podremos resolver mucho más en el camino.
Opción 2: pronostiquemos pronósticos, LD y muchas cosas de moda para predecir el comportamiento de un sistema no lineal. Genial después de todo.

Sin embargo, la aplicación de tales enfoques no siempre es adecuada para la formulación inicial del problema.
Es una continuación de publicaciones anteriores .

¿Por qué tales enfoques pueden ser redundantes? Sí, por muchas razones: el tiempo que lleva encontrar una solución a un problema, el tiempo que lleva calcular, los requisitos para la cantidad de recursos informáticos, realizar cálculos con alta precisión, construir el modelo incorrecto, la alta complejidad de la solución analítica al problema directo, la alta complejidad de resolver el problema inverso y mucho más.

Pero hay una forma clásica de resolver tales problemas, que es especialmente buena si tienes una computadora poderosa a mano. Método Monte Carlo. Stat. análisis de los resultados de múltiples soluciones a un problema directo, que, por regla general, es bien algoritmizable.
Las respuestas necesarias, como primera aproximación, se pueden obtener en unas pocas horas, incluida la comprensión del problema, la codificación y la realización de cálculos preliminares.

A continuación hay solo 2 ejemplos.

Ejemplo 1. Combinatoria de listas anidadas

La tarea comercial inicial es expandir la base de capacitación del bot de chat en base a un pequeño conjunto de frases de entrada. Una gran selección de frases de origen simplemente no lo es físicamente. Pero puede expandirse significativamente mediante un análisis preliminar de la estructura de la oración y la generación de permutaciones permitidas por las reglas del lenguaje. Por ejemplo, "una tubería fluye en la habitación 6" y "en una habitación 6 fluye tubería" son esencialmente idénticos.

Entonces, una declaración formalizada. Hay una lista de niveles múltiples de listas anidadas. Es necesario generar casi todas las permutaciones posibles de la lista original de valores, siempre que las permutaciones de los elementos solo se permitan dentro de cada lista separada .

ll <- list(list('a', 'b', 'c'), 'd', list('e', 'f', list('g', 'h', 'i'))) #   factorial(3) * factorial(3) * factorial(3) * factorial(3)

Un bosquejo de una posible solución.

 #        ff <- function(x){ #    ,           res <- if(is.list(x)) { sample(x, length(x), replace = FALSE) %>% purrr::map(ff) } else { x } res } procLine <- function(row){ purrr::map(row, ff) %>% #    rlang::squash_chr() %>% stri_c(collapse = "") } #   ,     wks <- 1 future::plan(multiprocess, workers = wks) tic(glue("Generating permutations @ {wks} thread(s)")) df1 <- purrr::map(1:10^4, ~sample(ll, length(ll), replace = FALSE)) %>% #          # purrr::map_chr(procLine) %>% furrr::future_map_chr(procLine) %>% enframe(name = NULL) %>% distinct() toc()

Ejemplo 2. Predicción de colas de clientes

El esquema de medición es tal que es posible tomar indicadores externos del proceso (lo consideramos bastante complicado e inestable en el tiempo), como la hora de llegada y salida de los clientes, la estructura de la canasta y mucho más.

Opción número 1: resolver el problema de frente. Cero conocimiento teórico del artista intérprete o ejecutante + acumulación de la masa histórica de todo tipo de indicadores externos (características) y el uso de métodos de LD para el "ajuste". Se están haciendo algunos pronósticos, pero qué, por qué y cómo está más allá del alcance, es necesario utilizar "intérpretes" vinculados.

Opción No. 2 - Utilizamos el método científico de cognición. Abrimos la teoría de los sistemas de colas, construimos una estadística. Indicadores de proceso de acuerdo con los parámetros QS, lanzamos una simulación discreta parametrizada de servicio al cliente. Obtenemos un "modelo digital" del Sistema que tiene palancas de control y un poder analítico explicativo basado precisamente en la naturaleza de los objetos observados, y no en un conjunto de ciertas "características".
R tiene un gran paquete de simmer para esto. Toda la información y muchos ejemplos prácticos aquí .

Publicación anterior: "Algunos toques para trabajar con identificadores bigint en R" .

R, Monte Carlo y tareas empresariales

Ejemplo 1. Combinatoria de listas anidadas

Ejemplo 2. Predicción de colas de clientes

More articles: