قابلية جمع المعطيات في habrablogs

السنة الجديدة - حان وقت التقييم. وإذا كنت تقوم بالتدوين على مركز ، أو كنت مهتمًا بالاطلاع على الإحصائيات الموجودة على مدونة شخص آخر ، فقد تكون الأداة المساعدة مفتوحة المصدر في متناول يدي.



ما هي الإحصاءات التي تنتجها؟


ملف CSV يحتوي على معلومات أساسية حول جميع المقالات:

  • الاسم
  • تصنيف المادة
  • عدد المواقع المفضلة
  • عدد المشاهدات
  • عدد التعليقات
  • المؤلف
  • رابط للمقال


(يتوفر إصدار أكبر من لقطة الشاشة عن طريق النقر)

ملف CSV يحتوي على معلومات مؤلف المدونة المسؤول عن عدد مرات المشاهدة / التعليقات / الإيجابيات / الإشارات المرجعية.



ملف CSV بمعلومات مماثلة ، ولكن تم تجميعها حسب لوحات الوصل.



ملف CSV بمعلومات مماثلة ، ولكن تم تجميعها حسب العلامات. لتنزيل العلامات ، يجب عليك ليس فقط تحميل قائمة المقالات ، ولكن أيضًا كل مقالة على حدة ، لذا إذا لم تكن في حاجة إليها ، فإن علامة -skipTags هي فكرة جيدة لتسريع عملية تنزيل البيانات.



حسنا ، وكمكافأة - ملف JSON مع نفس المعلومات.



من أين تحصل


المصادر موجودة على GitHub ، الأداة مكتوبة في Java 10 ، وجار JAR تم تجميعها بالفعل ، تعليمات الاستخدام والأمثلة موجودة في نفس المكان في قسم الإصدارات.

كيف تعمل وكيف تستخدم؟


نظرًا لأن Habrahabr API هو أسطورة * ، فإن الأداة المساعدة تقوم ببساطة بتوزيع HTML على jsoup. يمكنك تعيين أداة مساعدة ضد كل من المدونات الشخصية والمدونات الخاصة بالشركات - كل هذا هو نفسه.

لمدونات الشركات - أعط البرنامج رابطًا للمدونة نفسها ، على سبيل المثال https://habr.com/company/JetBrains/

بالنسبة للمدونات الشخصية ، يلزمك تحديد صفحة بها منشورات ، على سبيل المثال: https://habr.com/users/milfgard/posts/

تم تضمين تعليمات أكثر تفصيلاً في التطبيق ، بالإضافة إلى وجود ملف التمهيدي في المستودع.

* ربما لا ، لكن لم أتمكن من العثور على هذه المعلومات

لقد وجدت خلل / أريد ميزة أخرى


إنه ليس سؤالًا - اترك الأخطاء أو الرغبات في مشكلات github والاقتراحات والتحسينات - هناك في شكل طلبات سحب. حسنا ، أو هنا في التعليقات!

Source: https://habr.com/ru/post/ar434226/


All Articles