لن تكون هناك شبكات عصبية وصيغ معقدة تحت القطة ، سيتم فقط وصف العلامات التي اكتشفت فيها السير على ركبتي ، ومقارنة نتائج التصفية لهذه العلامات مع التصفية بواسطة خدمة واحدة معلنة ورابط إلى صفحة مع تنفيذ js ، يمكن لأي شخص من خلالها اختبار الفلتر بنفسه القائمة الخاصة بهم أو اختبار آخر من انضموا إلى مجتمعهم.
صورة لجذب الانتباه:

الخلفية
في الآونة الأخيرة ، كنت بحاجة إلى جمع إحصاءات حول العدد الأسبوعي للمشتركين الجدد في مجتمعات الزفاف التجارية. لهذه المهمة ، تم كتابة برنامج نصي جمع المشاركين الجدد في المجتمعات الضرورية وأنتج أرقامًا مشرقة ، للوهلة الأولى. كل ما في الأمر أنهم توقفوا عن الظهور بشكل وردي بعد التحقق من الحسابات العشوائية من القائمة المجمعة: تم حظر البعض من قبل الشبكة الاجتماعية في يوم الجمع ، وتبين أن بعض البوتات أو العروض المفتوحة (في المستقبل سأدعو كلا البوتات).
للحصول على أرقام حقيقية ، كان من الضروري معرفة الحصة التقريبية للبوتات في المشتركين الذين تم جمعهم. حاولت تنظيف الجمهور من الروبوتات بواسطة صياد مستهدف (الخدمة الأولى التي لفتت انتباهي والتي تسمح لك بتصفية الروبوتات مجانًا) ، ولكن تبين أن جودة التنظيف كانت كذلك (من بين الخدمات المتبقية ، كانت هناك حسابات مزيفة ، والكثير). قررت عدم استخدام خدمات مثل "الدفع ، ثم سنريك ما بوسعنا" - المال مؤسف ، ونتيجة لذلك الصندوق الأسود نفسه والنتيجة المريبة. قررت دراسة صفحات الروبوتات وكتابة الفلتر الخاص بي.
الذي نقوم بالتصفية
بادئ ذي بدء ، سأوضح ، كان هدفي هو تصفية الحسابات التي رأيت أنها تافهة من حيث دعوتهم إلى مجتمعات الزفاف التجارية. يتضمن هذا التعريف كلا من برامج الروبوت التي تدخل على الجهاز ويقدم أن شخصًا ما يصنع 100500 لكل منها ثم يبيعها على أنها "مشتركين حقيقيين". من الواضح أن العروض التي يلتقطها الطالب يدويًا لن تشتري أي شيء بنفس طريقة البوتات التي تلحق بالبرنامج النصي. ما يمكنهم القيام به بشكل جيد هو سحب إحصاءات الإعلانات مع دفع 1000 ظهور. يمكنه أيضًا جذب أشخاص حقيقيين تمامًا ، ولكن ما فائدة استخدامها في المنتدى إذا لم يروا مشاركته (كما أنه لا معنى لعرض إعلانات المنتدى لهم)؟
كيفية التصفية
بدت لي أبسط فكرة لتقييم كل حساب على مقياس من 0 إلى 100 ، حيث سجلت الروبوتات الصريحة 100 نقطة ، والبقاء العاديين في منطقة 0 (من الناحية المثالية. في الواقع ، يمكن لبعض الأشخاص الحقيقيين تسجيل 50 نقطة). هذه التقنية ليست مثالية (مثل كل شيء في الدرع ضد حرب السيف) ، ولكن كما أظهرت الممارسة ، لا يزعج منشئو الروبوتات حقًا عند إنشاء مزيفهم (سيكلف الروبوت المثالي أكثر من العميل الذي يجذبه الإعلان) ، لذلك في الوقت الحالي يعمل. لملء المقياس ، تم اختيار العديد من العلامات ، يمكن لكل منها إضافة أو تقليل عدد معين من النقاط ، وتعتبر الحسابات التي تسجل عددًا معينًا من النقاط (70-100 في حالتي) منخفضة الجودة ويتم تصفيتها. لن أكتب عدد النقاط التي تم تعيينها عند العثور على سمة معينة ، يمكنك رؤيتها في المثال الذي سيكون في نهاية المقالة ، حيث يمكن تغييرها ، وكذلك العتبة ، عند تجاوزها ، يتم إضافة الحساب إلى برامج الروبوت. والآن دعنا نراجع العلامات المحددة:
تم حظر الحساب
أول شيء أقوم بتصفية المستخدمين عليه. لا أعرف لماذا تترك الخدمات مثل هذه الحسابات (وتركتها الخدمة المذكورة أعلاه "tx"). سيستعيد الشخص الحي الذي يستخدم شبكة اجتماعية حق الوصول. من الأسهل لمرسل البريد المزعج أو سائق البوت الذي لديه ألف حساب إنشاء حساب جديد بعد الحظر. ولا يزال من المستحيل تحريف الإعلانات على المستخدمين المباشرين المحظورين.
لم يتغير ارتباط الصفحة
يسمح فكونتاكتي للمستخدمين بإدخال رابط فريد لصفحتهم بدلاً من معرف مجهول 12345678. هذه ليست علامة مهمة جدًا ، حيث لا يغيرها جميع الأشخاص الأحياء ، ويمكن أن يكون لجهات الاتصال المسروقة مثل هذا الرابط ، ولكن مع ذلك ، بالنسبة إلى برامج الروبوت المسجلة حديثًا ، يظل هذا الرابط دون تغيير.
بدون صورة رمزية
في عام 2018 ، لم يعد هذا مناسبًا للبوتات. بدلاً من ذلك ، يعد عدم وجود صورة رمزية أمرًا نموذجيًا لمزيفين من الأشخاص الكسولين تمامًا ، ولكن أعتقد أن هذا الجمهور ليس عالي الجودة. على أي حال ، هذه ليست علامة مهمة جدًا أيضًا.
هناك روابط لشبكات اجتماعية أخرى
هذه علامة جيدة لشخص حي. لم أجد طريقة لتعيين رابط إلى facebook / instagram عبر api. ربما كان يبدو سيئًا ، أو ربما لم يكن كذلك. ولكن وضع رابط للبوت أكثر صعوبة: يجب عليك على الأقل إنشاء هذا الحساب على الشبكة الاجتماعية وربطه بواجهة فكونتاكتي. لذلك ، فإن وجود مثل هذه الروابط في الملف الشخصي يعيد تعيين بضع نقاط على عداد معرف الروبوت.
لم يدخل الإنترنت لأكثر من 1-3 أشهر
في قرن عندما يكون لدى الجميع عميل وسائط اجتماعية مثبت على هواتفهم ، يبدو هذا النشاط المنخفض مريبًا. حتى لو لم يتم نسيان الروبوت من قبل المالك ، فمن الصعب العمل مع مثل هذا الشخص من خلال الإعلانات. عندما تحتاج إلى جمهور ساخن ، سيكون قد فات الأوان لتقديم الخدمة في غضون شهر (سيجدون بالفعل موفرًا آخر) ، وهذا الشخص غير متصل ولا يمكنك الوصول إليه. أكرر ما قيل في بداية المقال - لقد درست الجمهور حول موضوعات الزفاف ، لأن اتصالها الساخن مناسب. إذا قررت الترويج لجمهور ترفيهي أو متجر قائم على هوايات الأشخاص ، فقد يكون هذا العرض أقل أهمية بالنسبة لك.
اشترك في 500-1500 وأكثر من المجتمعات
علامة كبيرة ومهمة للحسابات غير المرغوب فيها. المادة الرئيسية لكسب الروبوتات هي الانضمام إلى مجموعات مختلفة (حسنًا ، نعم ، الإعجابات وإعادة النشر). ومن غير المحتمل أن يتمكن أصحاب botofarm من إخفائه. للسبب نفسه ، بالمناسبة ، يمكنك محاولة تصفية أولئك الذين يخفون مجموعاتهم من أعين المتطفلين (سيتم أيضًا التخلص من جنون العظمة في هذه الحالة ، ولكن هناك عدد قليل منهم بين جمهور VKontakte). حتى إذا قمت بتصفية شخص حي على هذا الأساس ، فلن يحدث شيء سيئ ، فمن غير المحتمل أن يرى أخبار مجتمعك في خلاصته ، حيث يتم الاشتراك في 1000 آخرين.
عضو مجتمع الترويج المتبادل
يجب ترك مثل هؤلاء الأشخاص فقط إذا كان جمهورك المستهدف من أطفال المدارس الذين يفتقرون إلى الاهتمام وقلة الاهتمام والكثير من وقت الفراغ. أنا شخصياً أعتبر مثل هذا الجمهور ليس مجرد قمامة ، بل إشارة مشرقة إلى أنهم ليسوا حقيقيين.
يتكون من العديد من المجتمعات حول مدن مختلفة
بصراحة ، لم أجد سببًا واحدًا يجعل الشخص العادي مهتمًا بمتابعة أخبار إصلاح الغسالة في كازان ، وإعلانات أومسك الخارجية ، ومجموعات كالوجا للتصميم الداخلي وعشر مجتمعات تجارية أخرى في مدن مختلفة في نفس الوقت. خاصة بالنظر إلى جودة المحتوى في 95٪ من هذه المجتمعات. لكن البوت ، كسب الانضمام إلى المجتمع مربح للغاية.
عضو في مجموعة بدون صورة رمزية
لا أعتبر هذه العلامة مهمة ، ومع ذلك ، أثناء الاختبار ، ظهرت مقالة حول الكشف عن الروبوتات على هذا الأساس. بشكل عام ، يمكن استخدام هذه المجتمعات كأرض تدريب تقني (من قبل المبرمجين للوصول إلى مفتاح المجتمع) ، يمكن أن تكون ببساطة صغيرة جدًا. ولكن عند مناقشة هذه العلامة مع أصدقائهم ، أخبروني أنهم لن ينضموا إلى هذه المجتمعات. بشكل عام ، ظلت هذه العلامة بالنسبة لي الأكثر غموضا ، مليئة بالأسرار والألغاز (وكذلك وجود مجتمعات بدون صور رمزية).
لا أحد يراقب منشورات المستخدم
هذه الأعراض أبسط بكثير. عادة ، إذا كان لدى المستخدم مجموعة من الأصدقاء ، ولكن في نفس الوقت ليس لديه تقريبًا أي مشاهدات على الحائط ، فإن أصدقائه هم تقليد. ولماذا تحتاج إلى تقليد الأصدقاء ، من أجل إعطاء حقيقة لحساب مزيف؟
تم وضع علامة على صورة المستخدمين الآخرين
في الوقت الحالي ، ليس لدى البوتات عادة وضع علامة على بعضها البعض في الصورة ، لكن الأشخاص الحقيقيين يلاحظون حقًا ، خاصة وأن الشبكة الاجتماعية تعرض القيام بذلك بشكل تدخلي للغاية (لدرجة أنها تقدم لي وضع علامة على صورة ملفي الشخصي). يشير وجود مثل هذه العلامة عادةً إلى حساب تم اختراقه أو مستخدم مباشر.
الاختيار عامل التصفية
للتحقق من فعالية البحث عن الروبوتات بواسطة هذه المعلمات ، تم كتابة
خدمة صغيرة تسمح لك بالتحقق من قائمة جهات الاتصال التي تم تنزيلها. أيضًا ، لكي تكون الدراسة ذات قيمة عملية للناس ، تمت إضافة القدرة على التحقق من مجتمعك إلى الخدمة - إذا كنت تدير مجتمعًا ، يمكنك تنزيل أحدث الأعضاء تلقائيًا والتحقق منهم. هذا مفيد إذا كنت قد استأجرت شخصًا للإعلان وهو يمنحك إحصائيات حول نمو المشتركين ، ولكن في نفس الوقت لا ترى زيادة حقيقية في الطلبات / التعليقات / الإعجابات.
تستخدم الخوارزمية طريقة wall.get للتحقق من السجلات من الحائط ، ولديها حد 1000 مكالمة في اليوم ، لذلك عند استخدام هذا البرنامج النصي لا يمكنك التحقق من أكثر من 1000 شخص. ومع ذلك ، هذا يكفي لتقييم جودة الجمهور. بالإضافة إلى ذلك ، يسمح لك البرنامج النصي بتعيين قيم الوزن الخاصة بك لكل سمة وعتبة لتحديد الروبوت ، لذلك إذا كنت لا توافق على أن هذه المعلمة أو تلك تحدد الروبوتات ، فيمكنك تعيينها على 0 ، أو العكس ، زيادة قيمتها.
اختبار ومقارنة النتائج
بناءً على نتائج المراجعة ، قام صياد مستهدف بتصفية 877 روبوت من جمهور اختبار من 2935 شخصًا. تصفية بواسطة الخوارزمية الموصوفة القضاء على 1984 شخصا. إذا شددت الفلتر وحددت فقط أكثر برامج الروبوت ضارًا (اشتركت في 500-1000 مجتمع ، جزء كبير منها عبارة عن مجتمعات مدن مختلفة ، إما محظورة أو تتكون في مجموعات ترويجية) ، سينخفض عدد الاكتشافات إلى 1215 شخصًا ، وهو ما يتجاوز أيضًا النتيجة الخدمة أعلاه. ومع ذلك ، فقد نظرت إلى حوالي عشرين صفحة من المستخدمين الذين اعتبرهم الصياد المستهدف المستخدمين العاديين ، وبدا أن خوارزميتي روبوتات وكان كل هؤلاء المستخدمين مشكوكًا فيهم ، وتحتوي العديد من الصفحات على إعادة نشر للخدمات المريبة (الكازينوهات ، المواعدة للبالغين ، المشاركة في المسابقات ، التوقعات الرياضية) ، أو عدد قليل من المشاهدات القياسية. لقد صادفت أيضًا حسابات مشابهة للحسابات التجارية التي روجت لبعض الخدمات ، لكنني شخصياً على استعداد لإهمالها ، خاصة بالنظر إلى أنها ، إلى جانب المجتمعات التي أحتاج إليها ، تشترك في عشرات الآخرين في وقت قصير وما إذا كانوا مهتمين بالموضوع الذي أحتاج إليه. على الرغم من أن مرشح أكثر ليونة قد يترك مثل هذه الحسابات. وبالطبع ، أفهم أن 20 صفحة لا تكفي للحكم على جودة جميع حسابات 1984.
على أي حال ، حصلت على نتائج ترضيني ، على الرغم من أنه إذا كان هناك وقت فراغ ، فسيكون من الممكن توسيع علامات البحث بشكل كبير عن الروبوتات. لكن تلك المذكورة أعلاه كافية (في الوقت الحالي) للحصول على نتيجة نوعية. ومرة أخرى
رابط لتطبيق الخوارزمية ، حتى لا يتم تخطي المقالة.