Análisis de habra: ¿es importante la duración de la publicación?


¿Sabes que Habr no es una plataforma social popular con una restricción en la longitud de publicación de 280 caracteres? Y aunque las publicaciones de un párrafo de largo aparecen periódicamente, rara vez se encuentran con su aprobación, residentes de Habra.


Hoy descubriremos si es cierto que las publicaciones largas son más populares y las cortas son viceversa. ¿O viceversa otra vez? En general, si en Habré hay discriminación en la extensión del artículo.


Entonces, los 5 centros más populares de la sección " Desarrollo ". Todos son de perfil, todos tienen más de 100,000 suscriptores. ¿Qué nos pueden decir? ¡Empecemos!


Esta pregunta se plantea con bastante frecuencia y recientemente fue preguntada nuevamente aquí por amartology .


Métodos


Para nuestra investigación, tomamos los centros de programación (266,000 suscriptores), seguridad de la información (518,000), código abierto (108,000), desarrollo de sitios web (529,000) y Java (124,000). Estos 5 tienen la calificación más alta en la sección.


La consideración afectará todo el 2019. Para cada centro, se seleccionan todas las publicaciones en este período de tiempo. Analiza todo el texto contenido en la etiqueta <div id = " post-content-body ">, así como las métricas de publicación como votos (total, más, menos, calificación final), vistas, marcadores y la cantidad de comentarios. Obviamente, la fecha y hora de publicación, su ID, autor y título también se tienen en cuenta.


La longitud del texto se cuenta en bytes ( strlen ), caracteres ( iconv_strlen ) y grafemas ( grapheme_strlen ).


Información general


Se encontraron un total de 4,805 publicaciones de 1,845 autores. Escribieron 114 014 297 bytes (108.73 MB) del texto, recogiendo 58 129 730 vistas, 351 582 marcadores y 145 194 comentarios. Entonces ( Fig. 1 ) todas estas publicaciones se ven en la línea de tiempo.



Fig. 1. Todas las publicaciones publicadas en cinco centros en 2019


Programacion


Este centro en 2019 reunió 1,908 publicaciones y 826 autores. La calificación total de publicaciones alcanzó +49 975 (↑ 57 588, ↓ 7 613 y 65 201 votos), y el número de visitas alcanzó 21 934 576. Además, se agregaron artículos a favoritos 161 535 veces, y también se comentaron 59 561 veces.


El tamaño total de las publicaciones es de 49 222 543 bytes (~ 46,94 MB), 33 514 654 caracteres o 33 282 885 grafemas.


Si solo calculas el promedio

La publicación representa +26.2 calificaciones (↑ 30.2, ↓ 4 y 34.2 votos), 11,496.1 vistas, 84.7 marcadores, 31.2 comentarios. El tamaño del texto es de 25.798 bytes, 17.565 caracteres o 17.444 grafemas.


Seguridad de la información


Este centro en 2019 obtuvo 1,430 publicaciones de 534 autores. La calificación total de publicaciones alcanzó +39 381 (↑ 43 874, ↓ 4 493 y 48 367 votos), y el número de visitas alcanzó 19 673 862. Además, se agregaron artículos a favoritos 80 893 veces, y también dejaron 48 859 comentarios.


El tamaño total de las publicaciones es de 31,025,982 bytes (~ 29.59 MB), 19,944,451 caracteres o 19,781,203 grafemas.


Si solo calculas el promedio

La publicación representa más de 27.5 calificaciones (↑ 30.7, ↓ 3.1 y 33.8 votos), 13,757.9 vistas, 56.6 marcadores, 34.2 comentarios. El tamaño del texto es 21 697 bytes, 13 947 caracteres o 13 833 grafemas.


Código abierto


Este centro en 2019 tiene 576 publicaciones y 305 autores, así como una calificación general de +17 735 (↑ 19 699, ↓ 1 964 y 21 663 votos), 6 750 210 vistas, 35 980 marcadores y 20 116 comentarios.


El tamaño total de las publicaciones es de 14 142 730 bytes (~ 13.49 MB), 9 598 387 caracteres o 9 529 648 grafemas.


Si solo calculas el promedio

La publicación representa +30.8 calificaciones (↑ 34.2, ↓ 3.4 y 37.6 votos), 11,719.1 vistas, 62.5 marcadores, 34.9 comentarios. El tamaño del texto es de 24 553 bytes, 16 664 caracteres o 16 545 grafemas.


Desarrollo de sitios web


Este centro en 2019 obtuvo 1.007 publicaciones de 415 autores. La calificación total de publicaciones alcanzó +28,300 (↑ 31,594, ↓ 3,294 y 34,888 votos), y el número de visitas alcanzó 12,567,099. Además, se agregaron artículos a favoritos 92,440 veces y también dejaron 26,625 comentarios.


El tamaño total de las publicaciones es de 23 370 415 bytes (~ 22.29 MB), 15 698 405 caracteres o 15 578 144 grafemas.


Si solo calculas el promedio

La publicación representa +28.1 calificaciones (↑ 31.4, ↓ 3.3 y 34.6 votos), 12,479.1 vistas, 91.8 marcadores, 26.4 comentarios. El tamaño del texto es de 23,208 bytes, 15 589 caracteres o 15 470 grafemas.


Java


Este centro en 2019 reunió 530 publicaciones y 279 autores. La calificación total de publicaciones alcanzó +9,820 (↑ 11,391, ↓ 1,571 y 12,962 votos), y el número de visitas alcanzó 43,677,863. Además, se agregaron artículos a favoritos 31,943 veces y se comentaron 8,990 veces.


El tamaño total de las publicaciones es de 13 574 788 bytes (~ 12,95 MB), 9 617 462 caracteres o 9 554 683 grafemas.


Si solo calculas el promedio

La publicación representa más de 18.5 calificaciones (↑ 21.5, ↓ 3 y 24.5 votos), 82,411.1 vistas, 60.3 marcadores, 17 comentarios. El tamaño del texto es de 25 613 bytes, 18 146 caracteres o 18 028 grafemas.


¿Hay una dependencia en la longitud?


La respuesta corta a esta pregunta es no. No hay dependencia de la calificación general ( Fig. 2 ), el número de ventajas ( Fig. 3 ) y desventajas ( Fig. 4 ) en el tamaño de la publicación. Si escribe 1,000 o 100,000 bytes de texto, la probabilidad de obtener +10 es casi la misma, exactamente la misma que para +50 o +100.



Fig. 2. Dependencia de la calificación de publicación en la longitud del texto





Fig. 3. La dependencia del número de ventajas de publicación en la extensión del texto.





Fig. 4. La dependencia del número de desventajas en la longitud del texto.


Como puede ver, varios puntos de publicaciones muy cortas quedan eliminados de las estadísticas. Estos incluyen publicaciones sobre eventos relacionados con Nginx y otras notas importantes en algún momento. En este caso, el texto de la publicación no se evalúa en absoluto.


La dependencia del número de vistas en la longitud del texto también se ve aproximadamente igual ( Fig. 05 ).



Fig. 5. La dependencia del número de vistas en la longitud del texto.


Tal vez esta es una idea? Verificaremos cómo la calificación depende del número de vistas.


Ver conteo


¿No es eso obvio? Más vistas - más calificaciones ( Fig. 6 ). Al mismo tiempo, la calificación no será necesariamente más alta, ya que puede obtener más desventajas ( Fig. 7 ). Además, más vistas, más marcadores ( Fig. 8 ) y comentarios ( Fig. 9 ).



Fig. 6. La dependencia del número de calificaciones en el número de vistas





Fig. 7. Dependencia de la calificación de publicación en el número de visitas





Fig. 8. La dependencia del número de marcadores en el número de vistas.





Fig. 9. La dependencia de la cantidad de comentarios sobre la cantidad de visitas


Más popular en 2019


Las 5 publicaciones principales incluyen:



En lugar de una conclusión


Que hacer ¿Escribir publicaciones largas o notas cortas? ¿Sobre popular o interesante?


No hay una respuesta obvia a esta pregunta. Por supuesto, si está buscando exclusivamente la aprobación (el número de ventajas), la mayor posibilidad de tener éxito es reunir más puntos de vista, y para esto necesita un título excepcionalmente alto o un tema popular.


Pero no olvidemos que Habr no existe por el bien de los títulos, sino por el bien de las publicaciones de alta calidad.


Eso es todo por hoy. Gracias por su atencion!


PD: si encuentra errores tipográficos o errores en el texto, hágamelo saber. Esto se puede hacer resaltando parte del texto y presionando " Ctrl / ⌘ + Enter ", si tiene Ctrl / ⌘, o mediante mensajes privados . Si ambas opciones no están disponibles, escriba sobre los errores en los comentarios. Gracias


PPS Quizás le interesen también mis otros estudios de Habr o quiera sugerir su tema para la próxima publicación, o tal vez incluso una nueva serie de publicaciones.


Dónde encontrar la lista y cómo hacer una oferta

Toda la información se puede encontrar en un repositorio especial de detectives de Habra . Allí puede averiguar qué propuestas ya se han expresado y qué ya está en curso.


Además, puedes mencionarme (escribiendo VaskivskyiYe ) en los comentarios de una publicación que consideres interesante para investigación o análisis. Gracias a Lolohaev por esta idea.

Source: https://habr.com/ru/post/482886/


All Articles