تعرف على عمر مستخدم VK أو ماذا يمكن أن يُبيّن الرسم البياني الاجتماعي

"أخبرني من هو صديقك وسأخبرك من أنت".
يوريبيدس 480-406 قبل الميلاد ه.

نظرت لفترة طويلة إلى واجهة برمجة التطبيقات (API) VK مثل قطة في الغسالة - لقد تأثرت بشكل كبير بفرصة إجراء نوع من الأبحاث في واحدة من أكبر الشبكات الاجتماعية ، والتي اخترقت العديد من مجالات حياتنا. وبمجرد طرح سؤال ، هل يمكن تحديد عمره من خلال الدائرة الاجتماعية لمستخدم شبكة اجتماعية؟




بالنسبة لأولئك الذين أرادوا معرفة العمر الخفي ، كان هناك اختراق صغير من قبل. تحتاج فقط إلى استخدام البحث من قبل الأشخاص ، وتحديد معلمات ضيقة بحيث يقع ملف التعريف المطلوب في SERP ، ثم استخدام البحث الثنائي لتحديد النطاق العمري. أو اتضح أن معلومات الاتصال تشير فجأة إلى سنة التخرج. ولا تحتاج إلى كتابة أي نصوص. لكن يمكن إخفاء العمر الخفي والمعلومات غير المباشرة ، والأهم من ذلك أن المقال لا يزال لا يتعلق بكيفية الحصول على مزيد من المعلومات الشخصية. تقترح المقالة تحليل أحد جوانب الرسم البياني الاجتماعي.

واحدة من أول الأشياء التي تتبادر إلى الذهن عند النظر في اتصالات الملف الشخصي: دعنا نرى سن زملاء الدراسة وزملاء الدراسة ، في الغالبية العظمى من هذا المستخدم سوف يكون عمر + 1 سنة. لهذا ، وذلك بفضل التعليم الثانوي العالمي. يوجد تحذير واحد فقط: تحديد زملاء الدراسة. كلما مر وقت التخرج ، كلما بدأنا بالتناوب في دوائر أكثر مخلوطة. يبدو أن أصدقاء المدرسة يعيشون في الماضي ، والآن أصبحوا غير محسوسين تقريبًا بين عدد كبير من الأصدقاء الجدد. هل من الممكن لملفات تعريف الأشخاص في سن النضج أن يفهموا بطريقة أو بأخرى ما الدرس الذي درسوه ، وبالتالي ، العمر التقريبي؟

لذلك ، دعونا ننظر في مهمة تحديد عمر المستخدم على أنه تحديد مجموعة فرعية من زملاء الدراسة وزملاء الدراسة. وهذا هو ، اتخذنا لافتراض أنه لديه في أصدقاء عدد معين من زملائه ، الذين يتوافق عمرهم تقريبًا مع عمر ملف التعريف. بالطبع هناك استثناءات ، لكنها نادرة. يذهب شخص إلى المدرسة من جرس إلى جرس لمدة 10 سنوات ، وخلال هذه الفترة تم إنشاء العديد من الاتصالات عبر المجتمع. باختصار ، يعرف الجميع بعضهم البعض ، بينما العمر المنتشر في هذا التشابك الاجتماعي هو الحد الأدنى. في المستقبل ، عندما ينضم الشخص إلى مجموعات أخرى ، كقاعدة عامة ، يكون العمر المنتشر فيها كبيرًا ، سواء كان ذلك نشاطًا رياضيًا أو نشاطًا رياضيًا أو نادي اهتمام. بناءً على هذا الاختلاف ، سنحاول تحديد الفئات الاجتماعية الضرورية.

لنلقِ نظرة على أحد ملفات تعريف VK مع الكثير من الأصدقاء. سنحصل على قائمة أصدقاء المستخدم باستخدام استعلام friends.get. سننظر في الملفات الشخصية فقط مع العمر المحدد ونضعها في الجدول الزمني في شكل رسم بياني حسب السنة. هناك فارق بسيط في كيفية تقسيم الكثير من الأصدقاء إلى فترات سنوية. بعد كل شيء ، نريد التأكد من أن زملاء الدراسة يدخلون فاصلًا زمنيًا واحدًا ، ولا ينتشرون على اثنين من المجاورين. لقد وجد بشكل تجريبي أن كسر السنة هو الأفضل في الخريف ، بحيث يدخل المستخدمون الذين لديهم تواريخ ميلاد في الفصل الأصفر مباشرة إلى فترتين متجاورتين. أي ، يتم الحصول على فواصل زمنية مدتها 15 شهرًا من سبتمبر إلى نوفمبر بزيادات قدرها 12 شهرًا.

oX هو عمر المستخدمين ، oY هو عدد المستخدمين الذين يقعون ضمن فترة زمنية معينة.

نلاحظ هضبة مدتها خمس سنوات بحد أقصى سنوي لعدد الأصدقاء. ليس من الواضح على الإطلاق العثور على مجموعة من الأقران خلال فترة الخمس سنوات هذه. في الحقيقة ، هذه الصورة ليست نموذجية. في أكثر الأحيان ، تبرز سنة ميلاد الزملاء / زملاء الدراسة من الآخرين عن طريق المزيد من الأصدقاء. ولكن في الحالات الصعبة لكل مستخدم ، نجد نسبة الصداقات داخل المجموعة السنوية إلى عدد الاتصالات مع أصدقاء آخرين من المستخدم الأصلي ، والذين نحدد العمر لهم ؛ ثم نحن متوسط ​​هذا المؤشر لكل عام. نحن نسمي هذا معامل التطبيع المعياري.

oX هو عصر المستخدمين ، oY هو المعامل الطبيعي للتوصيلية لفترة زمنية محددة.

لقد تغيرت الصورة ، والقادة لديهم سنة واحدة. يمتلك الفريق الذي يتمتع بعمر منتظم حصة كبيرة فيه ، وبالتالي يحق لنا أن نتوقع أنه نظرًا لأن المستخدم جزء منه ، فإن لديه نفس العمر. ولكن ماذا لو لعب شخص ما في هذا المجتمع بعض الدور الخاص ، على سبيل المثال ، ليس زميلًا في الصف ، ولكن معلمًا؟ في الواقع ، بالنسبة إلى المعلمين / المدربين ، قد يكون هناك مجموعات فرعية ذات كثافة عالية من الاتصالات في فترة زمنية ضيقة. جزئيًا ، يمكن التعامل مع هذه الحالة إذا ، عند اختيار مجموعة ، ليس بأعلى اتصال ، ولكن مع أعلى عمر بين المجموعات ذات الاتصال الكبير بما فيه الكفاية. بمعنى آخر ، استخدم المنطق القائل بأن الشخص في مسار حياته يجب أن يكون أولاً طالبًا عاديًا ، وعندها فقط يلعب دورًا مميزًا في "فرق ذات عمر موحد".

وصف أكثر تفصيلا وبعض الصيغ
التعبير عن اكتشاف عددي على ظاهرة الرسم البياني. دع F0 تدل على مجموعة أصدقاء المستخدم الذي يتم حساب العمر له. فاي - العديد من الأصدقاء من أي ملف تعريف. Fi ، y هي مجموعة أصدقاء الملف الشخصي التي لها تاريخ ميلاد محدد في الفاصل السنوي y. ثم i ، y هو اتصال الملف الشخصي i في الفاصل الزمني الخاص بك:

،،


y هو معامل التوصيل غير الطبيعي في الفاصل y لجميع التوصيفات:

،،


وأخيراً ، سنة الميلاد المطلوبة:

،



كانت هناك أيضًا فكرة للنظر في نوع هذا الاتصال أو ذاك الذي ينتمي إليه. إذا كان نوع الاتصال هو أصدقاء المدرسة أو الجامعة ، ففكر فيها بزيادة الوزن. وإذا كان نوع الزميل والأقارب وكل شيء آخر ، فلا تأخذ في الاعتبار مثل هذه العلاقات بشكل عام. ومع ذلك ، إذا استخدمت طلبات لتنزيل هذه المعلومات ، فسوف يزداد وقت الانتظار بمعامل 5. وبالإضافة إلى ذلك ، فإن تحديد نوع الاتصال ليس ممارسة شائعة ، لذلك تقرر طلب هذه المعلومات فقط لملفات التعريف مع عدد قليل من الأصدقاء.

من الخوارزمية أعلاه ، تتبع الحدود الطبيعية لتطبيق النهج لتحديد العمر. إذا كان المستخدم لا يعاني من الحنين إلى سنواته الدراسية ، وليس لديه أصدقاء لزملائه / زملائه في الفصل ، فيجب علينا استخدام طريقة أخرى.

ماذا عن محاولة هذه الفوضى في العمل؟ تم تنفيذ خدمة فكاهية في مجموعة VK "Fortune Teller of the Age" . هناك ، سيفقد الروبوت المألوف العمر إذا قمت بإسقاط رابط إليه على ملف تعريف VK غير مغلق باستخدام الخوارزمية أعلاه.

كيف يتم ترتيب الخدمة
أول رابط في عمل العراف هو آلية الرسائل لمجموعة VK. في إعدادات المجموعة ، يتم توصيل واجهة برمجة تطبيقات معاودة الاتصال بخادمها الخاص. لأنواع الأحداث المرسلة ، حدد "رسالة واردة". بهذه الطريقة ، تتحول رسالة المجموعة إلى طلب على خادمنا. إذا لم تكن صديقًا للواجهة الأمامية مثلي تمامًا ، فهذا خيار رائع. بعد ذلك ، من الخادم ، يتم استدعاء واجهة برمجة التطبيقات (VK) مع user.get طلبات الحصول على ملف التعريف المطلوب و friends.get لأصدقاء الملف الشخصي مع تاريخ ميلاد معروف. يتطلب تنفيذها الوصول إلى تطبيقات رمز مميز VK. لم أستخدم الطلبات التي تتطلب تأكيد حقوق المستخدم ، حتى لا أقوم بتحميل الأشخاص الذين لديهم طلبات للحصول على إذن بالدخول. بعد إجراء حساب العمر المقدر ، يتم تشكيل استجابة للطلب المقدم من المجموعة ، ويرى مستخدم العراف الإجابة في مربعات الحوار. رخيصة والبهجة.

فيما يتعلق بتحسين الخوارزمية نفسها ، لا يوجد شيء يمنعك من الذهاب إلى أبعد من ذلك ، حيث تقوم بجمع مجموعة بيانات التدريب من ملفات التعريف ذات الأعمار المحددة وتدريب نموذج الانحدار استنادًا إلى ، على سبيل المثال ، مصفوفة متقاربة من رسم بياني للعمر بين أصدقاء الملف الشخصي. أنا متأكد من أنه مع عينة كبيرة بما فيه الكفاية ، ستكون النتائج أكثر دقة من الاستدلال. كما ذكرت أعلاه ، كنت فضولية لمعرفة الفكرة الأساسية ، لذلك أنا لا أخطط لتطوير هذا الاتجاه.

في الختام ، أود أن أتناول الجانب الأخلاقي. في رأيي ، فإن "Fortune Teller of the Age" يقع على حدود الحياة الخاصة ، لكنه لا يزال لا يعبرها ، لأنه يستخدم البيانات المفتوحة للتحليل. في الواقع ، لذلك ، بالنسبة للمستخدمين الذين لديهم ملف تعريف مخفي ، لن تعمل الخدمة.

هناك شعور بأن جميع أنواع "العرافين من العمر" ، مثل محركات البحث ، SearchFace ليست سوى العلامات الأولى لعالم شفاف اجتماعيا. إلى حد ما ، يمكن أن يسمى هذا العودة إلى الأساسيات. كان الإنسان لفترة طويلة موجودا في المجتمعات الصغيرة ، حيث كان الجميع ينظرون إلى بعضهم البعض. كانت السمعة المفتوحة جزءًا لا يتجزأ من آلية التنظيم الاجتماعي. نعم ، ستتيح الأدوات الجديدة تدريجياً إعادة التفاعلات الاجتماعية للشخص بشكل كامل ، الآن فقط على المستوى العالمي. نعم ، مثل أي أداة ، يمكن استخدامها على حساب. هل أحتاج إلى جعلها في متناول الجميع؟ لا اعرف لكنني متأكد من أنه إذا كانت هذه الأدوات متاحة فقط لدائرة محدودة من الناس ، فلن يتحول بالتأكيد التوازن نحو الاستخدام البناء.

Source: https://habr.com/ru/post/ar447992/


All Articles