Habrautilidade para coleta de haastastatistics em habrablogs

Ano Novo - hora de fazer um balanço. E se você está blogando em um hub ou está interessado em analisar estatísticas no blog de outra pessoa, meu utilitário de código aberto pode ser útil.



Que estatísticas produz?


Arquivo CSV com informações básicas sobre todos os artigos:

  • o nome
  • classificação do artigo
  • número de favoritos
  • número de visualizações
  • número de comentários
  • o autor
  • link para o artigo


(uma versão maior da captura de tela está disponível por clique)

Um arquivo CSV com informações de que o autor do blog é responsável pelo número de visualizações / comentários / vantagens / indicadores.



Um arquivo CSV com informações semelhantes, mas agrupadas por hubs.



Um arquivo CSV com informações semelhantes, mas agrupadas por tags. Para fazer o download de tags, é necessário carregar não apenas a lista de artigos, mas também cada artigo individualmente. Portanto, se você não precisar, o sinalizador -skipTags é uma boa ideia para acelerar o processo de download de dados.



Bem, e como um bônus - um arquivo JSON com a mesma informação.



Onde obter


As fontes estão no GitHub , um utilitário está escrito em Java 10 e o JAR já foi compilado , instruções de uso e exemplos estão no mesmo local na seção de releases.

Como funciona e como usar?


Como a API Habrahabr é um mito *, o utilitário analisa de maneira simples e sombria o HTML por meio do jsoup. Você pode definir o utilitário em blogs pessoais e corporativos - é tudo a mesma coisa.

Para blogs corporativos - forneça ao programa um link para o próprio blog, por exemplo, https://habr.com/company/JetBrains/

Para blogs pessoais, você precisa especificar uma página com postagens, por exemplo: https://habr.com/users/milfgard/posts/

Ajuda mais detalhada está embutida no aplicativo, além de haver um arquivo leia-me no repositório.

* talvez não, mas não consegui encontrar essas informações

Encontrei um bug / quero outro recurso


Não é uma pergunta - deixe erros ou desejos em questões , sugestões e melhorias no Github - na forma de solicitações de recebimento. Bem, ou aqui nos comentários!

Source: https://habr.com/ru/post/pt434226/


All Articles