
¿Sabes que Habr tiene editores? Los que son personas. Es gracias a ellos que la sección de noticias nunca se vacía, y siempre tienes la oportunidad de bromear sobre el legado de Alizar .
En la cuenta de los editores docenas de publicaciones por semana para cada uno. A veces, los usuarios de Habr incluso suponen que en realidad no son personas, sino simplemente algoritmos para encontrar y adaptar materiales.
Hoy trataremos de averiguar cuánto dura su día de trabajo, si descansan y si tienen vacaciones. ¿O tal vez son robots? Al menos un poco. Nueva historia de detectives sobre Habré. Será interesante ¡Empecemos!
Buscar víctimas
No es difícil determinar qué usuario de Habr es el editor. Son prolíficos y escriben, escriben, escriben. Algunos de ellos escriben publicaciones regulares, otros escriben noticias y otros escriben ambos. Hoy nos concentraremos en las noticias. En el momento de mi análisis inicial, la última página de noticias visible No. 50 contenía publicaciones a partir del 3 de septiembre de 2019. Diciembre está en el patio, lo que significa que encontrar publicaciones en 3 meses no es difícil. Para una cuenta par (en realidad no), tomé el período del 04/09/2019 al 04/04/2019, por lo que ninguno de los días se incluyó en los datos solo parcialmente. Además, ha pasado una semana completa desde el 4 de diciembre y algo me dice que nadie leerá especialmente esta noticia. Y en consecuencia, no los editarán / ocultarán en borradores.
Entonces, tenemos 92 días para los cuales se publicaron 946 publicaciones en la sección de Noticias. Las estadísticas de los autores son las siguientes:
Fig. 1. Estadísticas de publicaciones de noticias.
220 publicaciones fueron maybe_elf , 139 - AnnieBronson , 129 - denis-19 , 122 - marcas y un total de 86 - alizar . Total - 696 noticias de 5 autores. Ninguno de ellos se esconde y está claramente escrito en el perfil de cada uno que trabajan en Habré. Otros 6 autores escribieron más de 10 publicaciones en 92 días y 19, más de una. En una publicación en las noticias publicaron 52 cuentas.
La lista de los que publicaron más de 10 noticias en 92 días. Como estamos interesados en saber cuándo trabajan los editores y cuándo se relajan, los mejores son los que publicaron la mayor cantidad posible: los tres primeros. Después de todo, espero que no descansen, y el trabajo las 24 horas traicionará a cualquiera.
Suponga que es injusto comparar a quienes han trabajado como editor durante varios meses con quienes han estado en Habré durante años. O simplemente leyendo las 7.3 mil marcas de publicaciones y 8.8 mil publicaciones que realmente no quiero. Entonces tal vez tú , AnnieBronson y Denis -19 .
Recogida de datos
Como no quería ordenar manualmente todas las publicaciones un poco más que nunca, utilicé métodos automatizados. Por un lado, esto privó la recopilación de datos de esa calidez y apariencia de lámpara que está tan cerca de mí y siempre captura la mente. Por otro lado, algo me dice que si bien volveré a leer, o al menos hojearé todo lo que se ha escrito, la cantidad de publicaciones para leer puede duplicarse.
Entonces Se registra la lista de publicaciones de cada autor, disponible en habr (.) Com / es / users / username / posts / from page 1 to page 20. En el siguiente paso, se descarga cada publicación y la información necesaria se escribe en una tabla común de las publicaciones del autor.
Información recibida- ID de publicación;
- fecha y hora;
- nombre
- calificación (votos totales, más, menos, calificación final);
- el número de marcadores;
- cantidad de vistas;
- Número de comentarios.
Solo una parte de la información se utilizará en esta historia, pero todo no sería demasiado racional para descargar publicaciones y no recopilar todo lo que sea posible.
Vale la pena señalar que a partir de esta sección en adelante, se consideran todos los tipos de publicaciones, no solo las noticias. Esto es necesario para completar las estadísticas.
Y después de mirar de cerca el monitor, puedes encontrar mucho ...
Resultados
1er lugar
Comencemos con el editor Habr más activo en los últimos 3 meses. Al registrarse el 26 de septiembre de 2019 , maybe_elf inmediatamente comenzó a escribir, pero nunca escribió un solo comentario. La productividad máxima de 6 publicaciones por día se alcanzó 7 veces y no hubo publicaciones durante 15 días. Obtengamos más detalles ahora.
Fig. 2. quizás_elf estadísticas de publicación
Puede notar que los editores tienen un fin de semana. Aunque, aparentemente, no todas las semanas. Puede encontrar una lista de fines de semana debajo del spoiler. Quizás tenía vacaciones de 8 días a principios de noviembre, así como 3 sábados gratuitos y 4 domingos en 80 días. ¿Por qué irse, no baja por enfermedad? El hospital apenas terminaría el sábado y el domingo inmediatamente para ir a trabajar.
Lista de vacaciones10/05/2019 (sábado);
10/06/2019 (sol);
10/12/2019 (sáb);
13/10/2019 (dom);
20/10/2019 (dom);
11/02/2019 - 11/09/2019 (sábado - sábado);
12/01/2019 (dom);
12/07/2019 (sáb).
¿Qué pasa con el tiempo de trabajo? Las publicaciones se publican desde las 07:02 UTC (10:02 hora de Moscú, donde se encuentra la oficina de TM y Habr, si no me equivoco) y hasta las 21:59 UTC (00:59). El pico de productividad es de 10:00 a 10:59, y hay muy pocas publicaciones antes de las 8:00 y después de las 19:00.
Número de artículos por hora de publicación (UTC)5 (07:00 - 07:59);
25 (08:00 - 08:59);
27 (09:00 - 09:59);
33 (10:00 - 10:59);
26 (11:00 - 11:59);
20 (12:00 - 12:59);
17 (13:00 - 13:59);
24 (14:00 - 14:59);
21 (15:00 - 15:59);
15 (16:00 - 16:59);
13 (17:00 - 17:59);
10 (18:00 - 18:59);
7 (19:00 - 19:59);
5 (20:00 - 20:59);
2 (21:00 - 21:59).
Vale la pena aclarar que el tiempo de trabajo probablemente depende del día de la semana, porque algunos detalles. Por ejemplo, el viernes no hay publicaciones después de las 17:43, por eso es viernes. Pero las últimas publicaciones son los miércoles y jueves. Detalles debajo del spoiler.
Tiempo de actividad (UTC) según el día de la semana.08:39 - 18:25 (lunes);
07:10 - 19:54 (martes);
07:41 - 21:01 (miércoles);
07:02 - 21:59 (jueves);
08:33 - 17:43 (viernes);
07:24 - 17:43 (sábado);
08:36 - 18:27 (dom).
Como descubrimos que al menos uno de los editores definitivamente tiene un fin de semana (¿e incluso unas vacaciones?), Pasamos al tema más importante. A menudo intriga a los lectores de Habr y se comenta periódicamente en los comentarios a las publicaciones que menos le gustaron. Cantidad o calidad? ¿Los editores tienen una norma para las publicaciones?
Mi respuesta es si. Por qué Solo mira el número de publicaciones por semana. Con una envidiable regularidad, esta cifra cayó por debajo de 20 solo durante el período de descanso, así como en la primera semana de trabajo, que fue de 4 días en lugar de 7. El número promedio de publicaciones por semana es de 23.7, y los detalles semanales lo esperan bajo el spoiler.
Número de publicaciones por semana.22 (12/12/2019 - 14/12/2019);
22 (12/02/2019 - 12/08/2019);
22 (25/11/2019 - 01/12/2019);
27 (18/11/2019 - 24/11/2019);
23 (11.11.2019 - 17.11.2019);
3 ( 4 de noviembre de 2019-10 de noviembre de 2019);
24 (10.28.2019 - 03.11.2019);
25 (21/10/2019 - 27/10/2019);
26 (14 de octubre de 2019 - 20 de octubre de 2019);
26 (10/07/2019 - 13/10/2019);
20 (30 de septiembre de 2019 - 6 de octubre de 2019);
10 (26/09/2019 - 29/09/2019).
2do lugar
En segundo lugar con 139 publicaciones en 92 días está la editora Anya AnnieBronson (nombre de la información del usuario). Al comienzo de la escritura de Habra 20/06/2019, en su cuenta ya 255 publicaciones. El máximo por día es 5 (alcanzado 7 veces), y el día más productivo es el miércoles. 66 días de 178 fueron sin publicaciones.
Fig. 3. Estadísticas de publicación de AnnieBronson
El número de publicaciones por semana varía de 3 (solo una vez) a 17 (3 de esas semanas), y el número promedio de publicaciones es de 9.8 por semana.
Número de publicaciones por semana.12 (9/12/2019 - 14/12/2019);
4 (12/02/2019 - 12/08/2019);
14 (25/11/2019 - 01/12/2019);
14 (18/11/2019 - 24/11/2019);
6 (11.11.2019 - 17.11.2019);
10 (04.11.2019 - 10.11.2019);
15 (28 de octubre de 2019 - 3 de noviembre de 2019);
8 (21/10/2019 - 27/10/2019);
7 (14/10/2019 - 20/10/2019);
13 (10/07/2019 - 13/10/2019);
17 (30 de septiembre de 2019 - 6 de octubre de 2019);
8 (23/09/2019 - 29/09/2019);
7 (16 de septiembre de 2019 - 22 de septiembre de 2019);
13 (09.09.2019 - 09.15.2019);
12 (2 de septiembre de 2019 - 8 de septiembre de 2019);
4 (26/08/2019 - 01/09/2019);
8 (19.08.2019 - 25.08.2019);
17 (12/08/2019 - 18/08/2019);
17 (08/05/2019 - 08/11/2019);
5 (29/07/2019 - 04/08/2019);
6 (22/07/2019 - 28/07/2019);
3 (15/07/2019 - 21/07/2019);
8 (07/08/2019 - 14/07/2019);
4 (01/07/2019 - 07/07/2019);
13 (24/06/2019 - 30/06/2019);
10 (20/06/2019 - 23/06/2019).
El tiempo de trabajo es un momento interesante. Las publicaciones comienzan a las 3:00 UTC y terminan a las 22:33. Alguien parece estar procesando un poco, pero eso no es exacto.
Número de artículos por hora de publicación (UTC)8 (03:00 - 06:59)
7 (07:00 - 07:59);
15 (08:00 - 08:59);
10 (09:00 - 09:59);
24 (10:00 - 10:59);
30 (11:00 - 11:59);
29 (12:00 - 12:59);
30 (13:00 - 13:59);
23 (14:00 - 14:59);
19 (15:00 - 15:59);
20 (16:00 - 16:59);
14 (17:00 - 17:59);
8 (18:00 - 18:59);
9 (19:00 - 19:59);
6 (20:00 - 20:59);
2 (21:00 - 21:59);
1 (22:00 - 22:59).
¿Cuál de los días de la semana es el más largo? La respuesta es el viernes. De hecho, no olvides que ignoro la fecha, sino que solo miro el día de la semana. Es probable que el horario simplemente haya cambiado dramáticamente. Y el 27 de septiembre de 2019 a las 03:00, algo interesante estaba sucediendo claramente.
Tiempo de actividad (UTC) según el día de la semana.07:16 - 19:26 (lunes);
07:29 - 19:37 (martes);
05:11 - 20:17 (miércoles);
06:00 - 22:33 (jueves);
03:00 - 20:12 (viernes);
05:20 - 20:31 (sábado);
05:00 - 20:11 (dom).
Otro hecho interesante, este editor también casi nunca escribe comentarios. 5 comentarios en 178 días sobre Habré.
3er lugar
El 3er lugar final de hoy con 129 publicaciones en 92 días es denis-19 . En total, tiene 359 publicaciones, algunas de las cuales fueron en 2018. ¿Cuándo se convirtió este usuario en editor o lo fue desde el principio? El número de publicaciones ha aumentado considerablemente desde el 01/08/2019. Desde ese momento, se escribieron 242 publicaciones, un promedio de 1.8 por día. Supongamos que esta fuera la fecha efectiva de la autoridad. Entonces, las estadísticas.
Fig. 4. Estadísticas de publicaciones denis-19
El día más productivo es el jueves y un número bastante significativo de publicaciones de fin de semana. ¿Y qué hay del tiempo de trabajo? La publicación más temprana es 02:27 UTC, la última es 23:25.
Un hecho que podría pasar desapercibido, pero no. 155 publicaciones de 242 (64.5%) se publican durante un múltiplo de 5 minutos (: 00 ,: 05 ,: 10, etc.). Por ejemplo, todas las publicaciones que comienzan a las 18:00 son solo eso. Esto sucede muchas veces al día. O alguien es muy preciso (y tiene mucho tiempo libre), o los artículos se preparan como de costumbre, y las automáticas los imprimen fuera de los borradores de la publicación.
Si una persona hace publicaciones, la cantidad de tiempo dedicado a cumplir con dicha plantilla es en promedio 2.5 minutos por artículo, es decir, aproximadamente 387.5 minutos para 155 publicaciones.
Para los otros dos editores, esta precisión recae en 54 de 250 publicaciones (21.6%, maybe_elf ) y 54 de 255 (21.2%, AnnieBronson ), lo cual es consistente con las estadísticas. El sistema de números decimales supone una probabilidad ideal del 20% para encontrar un número que termina en 0 o 5.
En este sentido, considero que no es interesante estudiar el momento de la publicación. Si no son cometidos por una persona, esto no proporcionará ninguna información, pero si es una persona, entonces él tiene superpoderes y no será posible averiguar nada.
Lista de las publicaciones más notables de hora redonda18:00 - 4 piezas;
17:50 - 4 piezas;
17:30 - 4 piezas;
16:00 - 6 piezas;
15:10 - 4 piezas;
08:40 - 4 piezas;
08:20 - 4 piezas;
08:00 - 4 piezas;
06:40 - 4 piezas;
06:00 - 4 piezas;
05:50 - 4 piezas;
etc.
El tiempo de actividad por día tampoco traiciona a una persona real.
Tiempo de actividad (UTC) según el día de la semana.03:51 - 23:25 (lunes);
04:00 - 18:30 (martes);
04:18 - 18:20 (miércoles);
02:48 - 23:00 (jueves);
04:30 - 17:50 (viernes);
02:27 - 18:50 (sábado);
04:10 - 16:00 (dom).
Otro punto que lo distingue de los otros dos editores es que a veces escribe comentarios. 360 piezas publicadas.
En lugar de una conclusión
Entonces, descubrimos cuántos editores de Habr trabajan (tres de ellos, los escritores de noticias más activos últimamente), que tienen fines de semana y que algunos de ellos son realmente personas y se van de vacaciones.
Y tropecé con otro enigma. Bueno, o al menos algo sospechoso. Parece que uno de los tres enumerados funciona en modo automático, al menos a veces.
Quizás esto no sea así. Pero tenemos un detective. Cualquier cosa puede pasar ...
Pensemos un poco más ...
Y eso es todo por hoy. Gracias por su atencion!
PD: si encuentra errores tipográficos o errores en el texto, hágamelo saber. Esto se puede hacer resaltando parte del texto y presionando " Ctrl / ⌘ + Enter ", si tiene Ctrl / ⌘, o mediante mensajes privados . Si ambas opciones no están disponibles, escriba sobre los errores en los comentarios. Gracias
PPS Quizás le interesen también mis otros estudios de Habr o quiera sugerir su tema para la próxima publicación, o tal vez incluso una nueva serie de publicaciones.
Dónde encontrar la lista y cómo hacer una ofertaToda la información se puede encontrar en un repositorio especial de detectives de Habra . Allí puede averiguar qué propuestas ya se han expresado y qué ya está en curso.
Además, puedes mencionarme (escribiendo VaskivskyiYe ) en los comentarios de una publicación que consideres interesante para investigación o análisis. Gracias a Lolohaev por esta idea.