Habrautility用于收集habrablog中的habrastatistics

新年-盘点时间。 而且,如果您在中心上写博客,或者对查看其他人博客的统计数据感兴趣,那么我的开源实用程序可能会派上用场。



它产生什么统计数据?


包含所有文章基本信息的CSV文件:

  • 名字
  • 文章评分
  • 书签数量
  • 观看次数
  • 评论数
  • 作者
  • 链接到文章


(可通过单击获得更大版本的屏幕截图)

一个CSV文件,其中包含博客作者负责查看/评论/加号/书签的数量的信息。



具有类似信息但按集线器分组的CSV文件。



具有类似信息但按标签分组的CSV文件。 要下载标签,您不仅需要加载文章列表,还需要分别加载每篇文章,因此,如果您不需要它,那么-skipTags标志足以加快数据下载过程。



好的,还有一个好处-具有相同信息的JSON文件。



去哪儿


来源在GitHub上 ,一个实用程序用Java 10编写,并且JAR已编译 ,使用说明和示例在发布部分的同一位置。

它如何运作以及如何使用?


由于Habrahabr API是一个神话*,因此该实用工具可以通过jsoup简单而沮丧地解析HTML。 您可以针对个人和公司博客设置实用程序-都一样。

对于公司博客-为程序提供指向博客本身的链接,例如https://habr.com/company/JetBrains/

对于个人博客,您需要指定一个包含帖子的页面,例如: https://habr.com/users/milfgard/posts/ : https://habr.com/users/milfgard/posts/

该应用程序内置了更详细的帮助,此外,存储库中还有一个自述文件。

*也许没有,但我找不到此类信息

我发现了一个错误/我想要另一个功能


这不是问题-在github问题 ,建议和改进中留下错误或希望-以请求请求的形式存在。 好吧,或者就在评论中!

Source: https://habr.com/ru/post/zh-CN434226/


All Articles