Citymobil: un manual para mejorar la disponibilidad en medio del crecimiento del negocio para las nuevas empresas. Parte 1



En esta primera parte de una serie de artículos "Citymobil: un manual para mejorar la disponibilidad en medio del crecimiento empresarial para nuevas empresas", voy a analizar la forma en que logramos escalar drásticamente la disponibilidad de los servicios de Citymobil. El artículo comienza con la historia sobre nuestro negocio, nuestra tarea, el motivo de esta tarea para aumentar la disponibilidad y las limitaciones surgidas. Citymobil es un agregador de taxis de rápido crecimiento. En 2018, aumentó en más de 15 veces en términos de número de viajes completados con éxito. Algunos meses mostraron un aumento del 50% en comparación con el mes anterior.

El negocio creció como una maleza en todas las direcciones (todavía lo hace): hubo un aumento en la carga del servidor, el tamaño del equipo y el número de implementaciones. Al mismo tiempo, surgieron las nuevas amenazas a la disponibilidad del servicio. La compañía enfrentó una tarea de la mayor importancia: cómo aumentar la disponibilidad sin comprometer el crecimiento de la compañía. En este artículo, hablaré sobre la forma en que logramos resolver esta tarea en un tiempo relativamente corto.

1. Definición de una tarea: ¿qué es exactamente lo que queremos mejorar?


Antes de mejorar algo, necesitamos aprender a medirlo para registrar las mejoras. Cuanto más cercano sea el valor medible a los términos del negocio, mejor. En términos de su éxito, nuestro parámetro más importante es un número de viajes completados con éxito (en adelante "número de viajes"). Este es el parámetro que los inversores están mirando al tomar una decisión con respecto a una inversión. Cuantos más viajes, más valiosa es una empresa.

Algunos viajes son rentables, algunos producen pérdidas. Pero también nos preocupamos por todos los viajes, incluso los no rentables, ya que permiten que aumente la cuota de mercado (de hecho, esta pérdida es un pago por el aumento de la cuota de mercado). Por lo tanto, cada viaje extra es algo bueno; y cada perdido, no lo es. Todos los viajes son iguales en términos de éxito empresarial.

Ahora tenemos un criterio de medición de disponibilidad fácil de entender: número de viajes perdidos: estos son los viajes que definitivamente perdimos debido a problemas técnicos. Por "problema técnico" queremos decir, por ejemplo, error de código, error interno del servidor 500, accidente de infraestructura, integración dañada con nuestro servicio asociado (por ejemplo, Google Maps).

2. ¿Cómo contar los viajes perdidos?


A veces es fácil contar los viajes perdidos, y a veces es difícil. Por ejemplo, en caso de falla total del servicio, cuando nada funciona (tocar madera), es muy fácil contar los viajes perdidos. Conocemos la tendencia del gráfico de número de viajes antes del accidente; vemos esta tendencia gráfica después del accidente; trazamos una línea entre el punto en que comenzó el tiempo de inactividad y el punto en que terminó. El gráfico del número de área de viajes debajo de esta línea completa representa nuestros viajes perdidos.

En el gráfico a continuación, la línea negra muestra los viajes de algún día y la verde, los viajes de la semana pasada. En el eje x - tiempo. En el eje y: número de viajes en una ventana de tiempo alrededor del punto x. Puedes ver una caída obvia en forma de un triángulo de ángulo agudo. Esta área triangular es el número de viajes perdidos. Naturalmente, es un número aproximado, ya que es un gráfico fluctuante. Sin embargo, entendemos que incluso una precisión del 10-20% es suficiente para evaluar la magnitud del accidente para el negocio.



Si el tiempo de inactividad no es total, sino parcial (todavía toca madera), la evaluación es un poco más complicada. Por ejemplo, si hay un error que causa la situación cuando el 10% de las órdenes no se distribuyen a lo largo de los vehículos, entonces en el gráfico de viaje vemos un barranco y luego rebota (después de que se solucionó el error). En esta situación, los viajes perdidos están representados por el área separada por la línea de tendencia en la parte superior, el gráfico del número de viajes reales en la parte inferior, el tiempo de inactividad comienza a la izquierda y el tiempo de inactividad finaliza a la derecha.

Como se ve en el gráfico a continuación, el pico descendente no es tan evidente, pero el número de viajes durante la semana anterior sin picos descendentes ayuda a comprender que este pico descendente significa pérdida. De hecho, la comparación de viajes durante el día y el mismo día de la semana pasada deja en claro que el pico más a la derecha no muestra los viajes perdidos, sino un barranco común para esa hora del día, ya que está correlacionado con la semana anterior.



Una línea de tendencia es generalmente difícil de construir, ya que es un diente de sierra. Esto es cuando la comparación semana a semana es útil. Si dibujamos dos líneas en el mismo gráfico: la semana pasada y la actual, vemos que ambas curvas son casi similares, y la única diferencia es que una se encuentra por encima de la otra (generalmente la semana actual es más alta que la anterior; aunque hay excepciones) suceda) La comparación semana a semana es bastante importante ya que cada día de la semana, debido a varias razones, tiene una forma gráfica diferente. Cuando miramos el gráfico de semana a semana, podemos decir la ubicación de la línea de tendencia de los viajes de hoy.

Obviamente, un viaje perdido por sí solo presenta un problema mucho mayor que un solo viaje perdido. Un cliente que necesita un viaje encontrará un camino a seguir; por ejemplo, puede usar un servicio competitivo y no volverá a nosotros más tarde. O lo hará, pero solo después de decepcionarse con nuestro competidor, lo cual es poco probable ya que nuestros competidores son fuertes. Más que eso, incluso si el competidor decepciona al cliente, no se da por hecho que el cliente decida volver a nosotros: ella creerá que todos tienen un mal servicio y no tiene sentido cambiar de un servicio a otro.

Por lo tanto, un viaje perdido debido a problemas técnicos significa, de hecho, varios viajes perdidos.

Para no confundirse en términos, llamemos a los viajes perdidos debido a problemas técnicos reales, viajes perdidos primarios; y los viajes perdidos debido a que un cliente nos dejó por nuestro competidor - viajes perdidos secundarios.

Idealmente, para estimar la pérdida comercial total de un viaje perdido primario, necesitamos calcular cuántos viajes perdidos secundarios generó. Por lo tanto, debemos multiplicar una cantidad de viajes perdidos primarios por un coeficiente K que pueda calcularse en función de la tasa promedio de uso del servicio y el tiempo promedio que necesita un cliente para regresar después de dejarnos para nuestro competidor.

Suponiendo que K no cambia mucho con el tiempo, sería suficiente para nosotros comprender la tendencia de pérdida de viajes para contar los viajes perdidos primarios, ya que la correlación de período a período entre los viajes perdidos primarios será la misma que el período correlación entre períodos entre los viajes perdidos secundarios. Ejemplo: si perdimos 1000 viajes primarios el mes pasado, entonces perdimos 1000 * K viajes secundarios y 1000 * (1+ K ) en total. Si, nuevamente, hemos perdido 500 viajes primarios este mes, entonces perdimos 500 * K viajes secundarios y 500 * (1+ K ) en total. Dicho esto, a pesar del valor del coeficiente K ahora perdemos 1000 * (1+ K ) / (500 * (1+ K )) = 2 veces menos viajes.

Incluso si el coeficiente K cambia con el tiempo (en función del tiempo: K (t)), todavía estamos interesados ​​en reducir la cantidad de viajes perdidos primarios. Porque si K (t) crece con el tiempo, definitivamente tenemos que hacer un esfuerzo para perder menos viajes primarios, ya que la pérdida financiera causada por cada uno de ellos es cada vez mayor. Por otro lado, si K (t) disminuye con el tiempo, significa que, por alguna razón, nuestros usuarios se están volviendo cada vez más leales, lo que significa que debemos cumplir con sus expectativas.

En resumen: nos esforzamos por disminuir la pérdida de viajes primarios. En la siguiente parte, voy a hablar sobre cómo funciona nuestro proceso y qué hemos hecho para mejorarlo. Estén atentos!

Source: https://habr.com/ru/post/449034/


All Articles