Jika jumlah komentar di bawah artikel oleh jack cepat mendekati 1000, pastikan - terlepas dari topik yang dinyatakan oleh penulis, srach mengamuk di dalam: fokus api politoty dikelilingi oleh ahli sofa tentang semua masalah, diagnosa psikiatris pada jarak jauh dengan gambar profil dan nama panggilan, transisi ke kepribadian, serangan sarkastik, sifat pedasnya yang lebih besar daripada darah xenomorphs, dan, tentu saja, hidangan wajib dalam kasus seperti itu adalah tuduhan timbal balik yang dibahas oleh pasangan Anda dan Anda secara eksklusif untuk hadiah dan / atau bertugas. Yang tampaknya berbahaya dan sulit, dan sekilas tampaknya tidak terlihat, dan tiga puluh keping perak tidak terletak di jalan.
Hal paling lucu dalam situasi ini adalah
bahwa orang-orang yang sangat terpengaruh oleh sindrom
Internet-seseorang-salah sering menghabiskan waktu dan keberanian untuk membuktikan kepada orang lain sama seperti dia
benar -
benar bebas bahwa dia melakukan hal yang persis sama
untuk uang atau pesanan . Apakah Anda mencari logika di sini? Bukan dia. Ini internet, sayang.
Mari kita ambil salah satu
pertanyaan yang relatif baru tentang dugaan diskriminasi teritorial pada Gitlab. 4 hari telah berlalu sejak publikasi artikel, dan, tentu saja, diskusi sejak lama telah beralih dari topik yang disebutkan sebelumnya untuk tanah yang jauh. Frasa-frasa ini berbunyi:
Orang sungguhan tidak akan dapat menentang apa pun untuk komentator profesional pada langganan ...
Pengguna (ini dan itu) hanya menghabiskan waktu yang tidak realistis pada komentar ...
Pada saat yang sama, aktivitasnya tidak memiliki pola yang biasanya melekat pada pengguna biasa ...
ps tapi itu membuat saya menulis penganalisa parser untuk komentator tersebut) Dengan indikasi aktivitas per jam, jumlah waktu per hari, per minggu, dll ... Topik yang bagus untuk artikel)
Jadi hentikan. Dan apa saja pola-pola ini "biasanya melekat pada pengguna rata-rata"? Penulis frasa ini dalam topik itu, sayangnya, telah diterjemahkan ulang, jadi Anda harus melakukannya secara acak.
Pertanyaan yang ingin saya sampaikan di depan mata Anda sudah jelas, berikut ini - apakah mungkin dengan metode statistik untuk setidaknya entah bagaimana andal membedakan pola-pola ini sehingga dapat menciptakan pengelompokan formal yang membedakan komentator kasual dari yang profesional? Bayangkan - "menurut Habr-Botometer, Anda 76% kemungkinan menjadi bot Kremlin." Ini akan jauh lebih keren daripada serangan karma satu sama lain.
Sayangnya, kompetensi saya tidak cukup bahkan untuk menebak cara menggali untuk memecahkan masalah seperti itu. Namun demikian, tadi malam saya merobohkan "di atas lutut" parser kecil primitif, yang (karena halaman komentar terbuka bahkan untuk pengunjung yang tidak sah) melakukan dua hal untuk saat ini - a) ia mengumpulkan statistik dari semua komentarnya (untuk saat ini, hanya waktu -stamp) dan menambah database MySQL; b) menggambar grafik waktu, menandainya tentang peristiwa mengirim komentar yang diambil dari database ini. Bahkan tanpa analisis rumit, ternyata cukup lucu. Seperti inilah diagram komentar saya. Penjelasan di bawah ini. Paling baik dilihat di jendela terpisah pada skala 100% atau lebih.

Pada sumbu horizontal adalah waktu, setiap piksel sama dengan satu menit, harga pembagian abu-abu sama dengan satu jam, seluruh garis horizontal sama dengan satu hari. Hari berjalan dari bawah ke atas sepanjang sumbu vertikal, harga pembagiannya adalah 365 hari.
Tidak ada yang menarik dalam diagram saya. Dapat dilihat bahwa saya suka tidur selama 7-8 jam, sering pergi tidur setelah tengah malam, dan kadang-kadang mengatur maraton komentar berjam-jam, dan bahwa kegiatan selama setahun terakhir melebihi atau kira-kira sama dengan yang selama lima tahun sebelumnya.
Atau, kawan
gecube menyimpan sumpah diam selama tiga setengah tahun, dan kemudian itu berhasil menembus ...

Diagram aktivitas habra-commenter yang khas terlihat seperti ini (ini
QtRoS )

Sebuah “lubang kosong” yang berbeda di sebelah kiri di suatu tempat di malam Eropa dan berkomentar dengan santai di siang hari, mungkin dengan gangguan selama setengah tahun.
Tapi tidak semua grafik membosankan! Bagaimana Anda suka ini:

Selama lebih dari dua tahun, kolega kami, rupanya, melatih kembali bioritme-nya untuk tidur dari malam Eropa di suatu tempat di bawah Bukit Atlantik Tengah, apalagi, secara merata dan bertahap, dan kemudian menghabiskan dua tahun lagi untuk kembali ke pantai Portugal. Berjalan? Berenang? Saya tidak bisa memberikan penjelasan yang masuk akal ... Tiga jam pertama terjaga, komentar-komentarnya terbang seperti senapan mesin, dan pada akhirnya saya sudah melihat sekali dalam satu jam bahwa semuanya dilakukan di sana.
Omong -omong,
0xd34df00d .
Dan inilah teka-teki lain:

Selama empat setengah tahun, kolega itu bertahan tanpa satu komentar pun - ia melihat bahwa ia berlatih di suatu tempat di biara-biara rahasia, bagaimana tidak tidur selama berhari-hari, menilai dari berapa banyak komentar yang dikirim dalam "lubang kosong".
Tetapi hal yang paling menarik di sini adalah anomali pada jam ke-16, yang berlangsung lebih dari tiga tahun dan secara bertahap memudar pada tahun lalu. Istirahat asap? Berjalan-jalan dengan anjing? Jogging? Apa lagi yang bisa merobek habrovchanin dari kaset komentar di puncak hari kerja dengan penentuan sehari-hari seperti itu? Saya mencungkil dan sebuah
sofa kentang , saya tidak bisa membayangkan disiplin diri seperti itu yang mampu dimiliki
khim .
Akhirnya, diagram terakhir untuk memikirkan:

Biasanya tidak memiliki "lubang mengantuk." Hanya nyaris tidak menebak kelebihan jumlah komentar yang dikirim pada sore hari dibandingkan yang dikirim sebelumnya.
Dengan semua keparahan Komsomol, saya mendesak
MTyrz yang terhormat
untuk melucuti senjatanya dan dengan jujur mengakui berapa banyak kakek nenek, cucu perempuan, serangga, dan tikus yang mengendalikan akun Anda dan komentar-komentar coretan.
Dan pada akhirnya, pertanyaan berbahaya - adakah yang bisa begitu tertarik dengan segala hal yang mereka inginkan untuk mengembangkan kode parser dan / atau mendapatkan database dump atau akses ke sana dan seterusnya? Pengetahuan saya sendiri dalam penambangan data dan metode visualisasi data hampir tidak melebihi pengetahuan umum. Sesuatu yang lebih pintar dan menarik daripada diagram-diagram kecil sederhana yang hampir tidak dapat saya pikirkan. Jika seseorang tertarik, tuliskan padaku di telegram (nama panggilan di profil).
Terima kasih atas perhatian anda!
UPD Saya memposting
kode sumber di GitHub .