Habrautilidad para recolectar estadísticas de habrablogs en habrablogs

Año Nuevo: es hora de hacer balance. Y si está blogueando en un centro, o si está interesado en ver estadísticas en el blog de otra persona, entonces mi utilidad de código abierto puede ser útil.



¿Qué estadísticas produce?


Archivo CSV con información básica sobre todos los artículos:

  • el nombre
  • calificación del artículo
  • cantidad de marcadores
  • cantidad de vistas
  • cantidad de comentarios
  • el autor
  • enlace al artículo


(una versión más grande de la captura de pantalla está disponible haciendo clic)

Un archivo CSV con información que el autor del blog es responsable de la cantidad de vistas / comentarios / más / marcadores.



Un archivo CSV con información similar, pero agrupado por centros.



Un archivo CSV con información similar, pero agrupado por etiquetas. Para descargar etiquetas, debe cargar no solo la lista de artículos, sino también cada artículo por separado, por lo que si no lo necesita, el indicador -skipTags es lo suficientemente bueno como para acelerar el proceso de descarga de datos.



Bueno, y como beneficio adicional, un archivo JSON con la misma información.



Donde conseguir


Las fuentes están en GitHub , una utilidad está escrita en Java 10, y el JAR ya está compilado , las instrucciones de uso y los ejemplos están en el mismo lugar en la sección de lanzamientos.

¿Cómo funciona y cómo usarlo?


Como la API de Habrahabr es un mito *, la utilidad analiza HTML simple y sombríamente a través de jsoup. Puede configurar una utilidad para blogs personales y corporativos; todo es lo mismo.

Para blogs corporativos: proporcione al programa un enlace al propio blog, por ejemplo https://habr.com/company/JetBrains/

Para blogs personales, debe especificar una página con publicaciones, por ejemplo: https://habr.com/users/milfgard/posts/

Se incluye una ayuda más detallada en la aplicación, además hay un archivo Léame en el repositorio.

* tal vez no, pero no pude encontrar esa información

Encontré un error / quiero otra característica


No es una pregunta: deje errores o deseos en los problemas de github , sugerencias y mejoras, en forma de solicitudes de extracción. Bueno, o justo aquí en los comentarios!

Source: https://habr.com/ru/post/es434226/


All Articles