آرثر Khachuyan: "البيانات الكبيرة الحقيقية في الإعلان"

في 14 مارس 2017 ، تحدث آرثر خاشويان ، الرئيس التنفيذي لشركة Social Data Hub ، في قاعة محاضرات BBDO. تحدث آرثر عن المراقبة الذكية ، وبناء النماذج السلوكية ، والتعرف على محتوى الصور والفيديو ، وكذلك الأدوات والدراسات الأخرى لـ Social Data Hub ، والتي تتيح لك استهداف جمهورك باستخدام الشبكات الاجتماعية وتقنيات البيانات الكبيرة.



آرثر Khachuyan (من الآن فصاعدا - AH): - مرحبا! مرحبا بالجميع! اسمي آرثر Khachuyan ، وأنا أدير شركة Social Data Hub ، ونحن منخرطون في مختلف التحليلات الفكرية المثيرة للاهتمام لمصادر البيانات المفتوحة ، ومجالات المعلومات ، وننفذ جميع أنواع الدراسات المثيرة للاهتمام وما إلى ذلك.

واليوم ، طلب زملاء من مجموعة BBDO الحديث عن التقنيات الحديثة لتحليل البيانات الضخمة ، والبيانات الكبيرة وليس الكثير عن الإعلان: كيف يتم استخدامها ، أظهروا بعض الأمثلة المثيرة للاهتمام. آمل أن تطرح أسئلة على طول الطريق ، لأنني أستطيع أن أبدأ في إزعاجي وأن لا أكشف عن الجوهر وما إلى ذلك ، لذلك لا تخجل.

في الواقع ، فإن الاتجاهات الرئيسية ، في مكان ما من نوع ما من الحلول "القريبة من bigdigit" ، كانت كلها واضحة - وهذا هو استهداف الجمهور ، والتحليل ، ونوع من التحليل والبحث التسويقي. ولكن من المثير للاهتمام دائمًا البيانات الإضافية التي يمكن العثور عليها ، والمعاني الإضافية التي يمكن العثور عليها بعد تطبيق التحليل.

لماذا نحتاج التكنولوجيا للإعلان؟


من أين نبدأ؟ الأكثر المفهوم هو الإعلان على الشبكات الاجتماعية. لقد أطلقتها اليوم في الصباح: لسبب ما ، يعتقد فكونتاكتي أنني يجب أن أرى هذا الإعلان المحدد ... للأفضل أو الأسوأ ، هذا هو السؤال الثاني. نرى أنني أندرج تحت فئة المجندون بالتأكيد:



أول شيء مثير للاهتمام والذي يمكن اعتباره حلاً تكنولوجيًا ... أول شيء أردت حله قبل أن نبدأ هو تحديد المصطلحات: ما هي البيانات المفتوحة وما هي البيانات الضخمة؟ لأن كل الناس لديهم فهمهم الخاص لهذا الموضوع ، وأنا لا أريد أن أفرض شروطي على أي شخص ، ولكن ... فقط حتى لا تكون هناك اختلافات.

شخصياً ، أعتقد أن البيانات المفتوحة هي جميع البيانات التي يمكنني الوصول إليها دون أي تسجيل دخول أو كلمة مرور. هذا ملف تعريف مفتوح على الشبكات الاجتماعية ، وهذا هو نتائج البحث ، وهذه سجلات مفتوحة ، وما إلى ذلك. البيانات الكبيرة ، حسب فهمي الخاص ، أرى هذا: إذا كانت هذه لوحة بيانات - إنها مليار سطر ، إذا كان هناك نوع من تخزين الملفات - إنها بيتابايت في مكان ما من البيانات. الباقي في المصطلحات الخاصة بي ليس بيانات كبيرة ، ولكن شيء موجود.

ملامح دقيقة للغاية التهديف وسجل


دعنا نذهب في النظام. الشيء الأول والأكثر إثارة للاهتمام الذي يمكنك التفكير فيه من خلال تحليل مصادر البيانات المفتوحة هو إنشاء ملفات تعريف عالية الدقة وتسجيل ملفات التعريف. ما هذا هذه قصة عندما يمكنك التنبؤ ليس فقط من أنت ، وليس فقط اهتماماتك في حساب الشبكة الاجتماعية الخاصة بك.

لكن الآن ، بالجمع بين مصادر مختلفة ، يمكنك فهم متوسط ​​مستوى راتبك ، وكم تبلغ شقتك ، وأين تقع. وجميع هذه البيانات يمكن استخدامها حرفيا من وسائل مرتجلة. على سبيل المثال ، إذا كنت تأخذ حسابك على شبكة اجتماعية ، راجع ، على سبيل المثال ، مكان إقامتك ومكان عملك ؛ فهم القسم الخاص بالنشاط التجاري للشركة التي تعمل فيها ؛ خذ تفريغ شواغر مماثلة من HH و SuperJob إذا كنت محللًا أو مديرًا أو غير ذلك. تعرف على المكان الذي تعيش فيه (قاعدة ، مثل CIAN) ، افهم كم يكلف استئجار منزل في هذا المكان ، وكم تكلف شراء منزل في هذا المكان ، للتنبؤ بالمبلغ الذي تكسبه. علاوة على شبكات التواصل الاجتماعي الخاصة بك ، يمكنك فهم مقدار سفرك ومكان وجودك ومدى ولاءك لصاحب العمل.

وفقًا لذلك ، من خلال هذا العدد الهائل من المقاييس ، يمكننا أن نفعل أي شيء. يمكننا أن نقدم لك المنتج الذي يثير اهتمامك. تخيل متجر على الانترنت؟ تذهب إلى هناك - يخبرك هذا المتجر عبر الإنترنت بحسابك على الشبكة الاجتماعية ويخبرك: "ماشا ، لقد انفصلت عن رجل ، هنا لديك منتجات معينة معينة". ليس هذا هو المستقبل القريب ...

كيفية تحديد الموقع الجغرافي للشخص؟


إجابات لأسئلة الجمهور:

  • عادة ما يعتبر 80 ٪ من جميع عمليات تسجيل الوصول هي المكان المحدد للإقامة. ولكن بالنسبة للأشخاص الذين لا يقومون بتسجيل الوصول إلى أي مكان ، فهناك العديد من الخيارات: إما تسجيل الوصول أو الموقع الجغرافي ، أو تحليل المنشورات والمنشورات طوال الفترة الزمنية التي يكون فيها أي شخص قد كتب أي شيء ... وفي مكان ما ، اسمح لشيء ما بالخروج مثل "أريد شراء عربة بالقرب من Academic" أو "رأيت مؤخرًا هنا كتابات قبيحة على الحائط." أي أن 80٪ تقريبًا من الأشخاص يمكنهم تحديد موقعهم الجغرافي ومكان عملهم ومكان إقامتهم وفقًا للبيانات أو البيانات الوصفية التي يمكن جمعها من الشبكات الاجتماعية.

    هذا ، مرة أخرى ، هو تحليل للوظائف. بمعنى أبسط ، هذا تحليل لعمليات تسجيل الوصول الجغرافي والمواقع الجغرافية في الشبكات الاجتماعية التي لا تحذف بيانات jpeg الأولية (يمكنك تحليل شيء عليها). ولكن بالنسبة للأشخاص الباقين ، فهذه عادة ما تكون عمليات بث نصية: إما أن يضيء "الشخص" موقعه عندما يكتب عن شيء ما ، أو "يضيء" هاتفه ، حيث يمكنك العثور على بعض إعلاناته على Avito أو حسابه على "Avto.ru". وفقًا لهذه البيانات ، يمكنك الجمع (على سبيل المثال ، "أنا أبيع سيارة بالقرب من ماياكوفسكايا") ونفترض هذا تقريبًا.
  • عادة الناس نشر هذا على الشبكات الاجتماعية. نحن نعمل فقط مع المصادر المفتوحة وهنا نتحدث حصريًا عن المصادر المفتوحة. عادةً ما يتم نشر الإعلانات ، أي ستين بالمائة من الوقت ، القصة الأكثر شيوعًا هي عندما "يلمع" الأشخاص رقم هاتفهم الحالي - هذه إعلانات لبيع شيء ما. إما في بعض المجموعات ، يكتب الشخص ("أبيع هذا أو ذاك هناك) ، أو يذهب إلى مكان ما.

    نعم! عادة ما يعلقون ، مثل: "أجبني أو ألقِ رسالة نصية قصيرة ، اتصل بي على الرقم. يحدث هذا غالبًا مع الأشخاص الذين يبيعون شيئًا ما أو يشترون على شبكات التواصل الاجتماعي أو يتواصلون مع شخص ما ... وفقًا لذلك ، يمكنك عندئذٍ ربط هذا التعريف به في معهد السيان ، إذا كان قد نشر شيئًا ما ، أو ، مرة أخرى ، على Avito. هذه ببساطة هي المصادر الأكثر شعبية والأعلى ، وستستمر - هذا هو Avito و CIAN وما إلى ذلك.
  • هذا يشير إلى متجر على الإنترنت. سيكون الإصدار التالي هو تقنية التعرف على الوجوه ومطابقة الملف الشخصي (سنتحدث عن ذلك). نظريًا ، يمكن أيضًا تطبيق ذلك على متجر غير متصل بالإنترنت. وبصورة عامة ، حلمي الكبير هو أنه عندما تظهر لافتات الشوارع ، عندما تمر بالكاميرا ، فإن ذلك "يقطع" وجهك. ولكن سيتم حظر هذه الحالة بموجب القانون ، لأنها تشكل انتهاكًا للخصوصية. آمل أن يكون ذلك عاجلاً أم آجلاً.
  • لدي من تجربة شخصية. في كثير من الأحيان ، عندما يكتب شخص ما شيئًا ما ، فأنت تعمل على بعض الحقائق من حياته التي لا يجب أن تعرفها ... الناس في معظم الحالات يشعرون بالخوف. ولكن! بناءً على الإحصاءات الحديثة ، انخفض عدد الحسابات المغلقة على الشبكات الاجتماعية بنسبة 14٪. يتزايد عدد المنتجات المزيفة ، ويزداد عدد الحسابات المفتوحة - حيث يتجه الناس بشكل متزايد نحو الانفتاح. أعتقد أنه بعد 3-4 سنوات سيتوقفون عن الرد بحدة على حقيقة أن شخصًا ما يعرف معلومات عنهم ربما لا ينبغي أن يعرفها. لكن في الواقع ، من السهل جدًا الحصول على نظرة على حائطها.

ماذا يمكن أن تؤخذ من المصادر المفتوحة؟


قائمة تقريبية من الأشياء التي يمكن فهمها بموثوقية عالية إلى حد ما من المصادر المفتوحة - إنها كذلك. في الواقع ، هناك المزيد من أنواع المقاييس المختلفة. ذلك يعتمد على العميل مثل هذا البحث. هناك بعض وكالات الموارد البشرية التي تهتم بما إذا كنت أقسم على الشبكات الاجتماعية أو في مكان ما في الأماكن العامة. شخص ما مهتم بما إذا كنت ترغب في نشر منشورات Navalny أو ، على العكس من ذلك ، في منشورات United Russia ، أو نوع من المحتوى الإباحي - تحدث مثل هذه الأشياء في كثير من الأحيان.

أهمها هي القيم العائلية والتكلفة التقريبية للشقة والمنزل والبحث عن السيارات وما إلى ذلك. لهذا السبب ، يمكن تقسيم الناس إلى مجموعات اجتماعية. هؤلاء هم مستخدمي "Tinder" في موسكو ، وهم (وفقًا لصورهم الموجودة على حساباتهم على Facebook) ؛ بناءً على اهتماماتهم ، يتم تقسيمهم إلى مجموعات اجتماعية مختلفة:



إذا اقتربنا من الإعلان ، فقد تركنا تدريجياً الاستهداف القياسي للإعلان عندما تختار في فكونتاكتي الشرطية أنك مهتم برجال من سن 18 عامًا ، مشتركين في مجموعات معينة. لدي هذه الصورة كذلك ، الآن سأريك:



خلاصة القول هي أن معظم الخدمات الحالية التي تحلل ، من حيث المبدأ ، الأشخاص الذين يقومون بتحليل الشبكات الاجتماعية ، يهتمون بتحليل الاهتمامات ... أول ما يتبادر إلى ذهن الناس هو تحليل المجموعات العليا من المشتركين فيها. ربما هذا يعمل مع شخص ما ، لكنني شخصياً أعتقد أن هذا خطأ جوهري. لماذا؟

أمثالك تجمع وتحلل


الآن ، خذ هاتفك ، وانظر إلى أفضل مجموعاتك - سيكون هناك بالتأكيد أكثر من 50٪ من المجموعات التي نسيتها بالفعل ، هذا نوع من المحتوى لا يهمك فعلاً. أنت لا تستهلكه على الإطلاق ، لكن النظام سوف يمدك وفقًا لها: أنك مشترك في الوصفات وبعض المجموعات الشعبية. أي أنك تنتهك النظام الذي يحلل ملفك الشخصي ، ولن يتم تبرير اهتماماتك.

الانتقال ... ما هو هناك؟ نحن نفترض أن بقية الناس يفعلون. الطريقة الأكثر ، في رأينا ، هي الطريقة المناسبة لتقييم اهتمامات المستخدمين. على سبيل المثال ، في فكونتاكتي لا يوجد مثل الخلاصة ، ويعتقد الناس أن لا أحد يعرف ما يحلو لهم. نعم ، تم تقديم بعض الإعجابات على Instagram ، ونحن نرى شيئًا ما على Facebook ، ولكن معظم المحتوى في مجموعات معينة لا يبث هذا بثًا مشتركًا ، ويعيش الناس ويعتقدون أنه لن يعرف أحد ما يعجبهم.

وعن طريق جمع محتوى معين من بعض المحتوى الذي يهمنا ، وجمع هذه المنشورات ، وجمع هذه الإعجابات ، ثم التحقق من هذا الشخص من قاعدة البيانات هذه ، يمكننا أن نحدد بدقة عالية من هو ، ما هو مصيره ، ما الذي يهمه. حدد بدقة في مجموعة اجتماعية معينة والتفاعل معها.

شراء سيارة يغير السلوك


لدي مثل هذا المثال. سأقوم فوراً بالحجز ولدي أمثلة على الإعلان القريب والتسويق القريب ، لأنه ، كما تعلمون ، معظم الحالات محمية من قبل NDA وما إلى ذلك. ولكن لا يزال سيكون هناك العديد من الأشياء المثيرة للاهتمام. لذلك ، القصة مع هؤلاء الناس: هؤلاء هم الرجال الذين اشتروا سيارة بين عامي 2010 و 2015. كيف تغير سلوكهم الاجتماعي على الشبكة هو لون مشفر. تم تغيير النسبة المئوية للفتيات في المشتركين ، واشتركت في جمهور "patsansky" ، ووجدت شريكًا جنسيًا دائمًا ...



يتم تقسيم هذا الأمر كله حسب ماركة السيارات وعدد الأشخاص. من هنا يمكنك استخلاص العديد من الاستنتاجات المثيرة للاهتمام حول سلوك الناس ، وكيف يعمل كل شيء. أستطيع أن أقول إن "بورش كايين" و "بريورا" المزروعة من حيث عدد الجماهير المستقطبات هي نفسها تقريبًا. نوعية هذا الجمهور ، وسلوكهم مختلف ، ولكن المبلغ هو نفسه تقريبا. الاستنتاج من هنا يمكن أن يتم ، أقرب إلى السوق الخاص بك ، أيا كان. أنت تبيع Audi ، تصنع شعار "Buy Audi" ، ابتعد عن والديك! "وهكذا.

نعم ، هذا مثال مثير للسخرية على حقيقة أن سلوك الأشخاص استنادًا إلى تحليل الإعجابات ، استنادًا إلى المجموعة التي يذهبون إليها ، والمحتوى الذي يقومون بتحليله ، يجعل من المحتمل هويتك 100٪ تقريبًا. لأنه إذا لم يكن لديك إمكانية الوصول إلى حركة مرور الشبكة ، لا تقرأ الرسائل الخاصة ، فسيخبرك دائمًا من هو هذا الشخص - امرأة حامل ، أم ، امرأة ، ضابط شرطة. وبالنسبة لك ، كما هو الحال بالنسبة للشخص الذي يمكنه الإعلان ، يعد هذا ضربة رائعة على الهدف.

إجابات لأسئلة الجمهور:

  • كل عمود هو عدد الأشخاص في سيارة معينة ؛ كيف تغير نمط سلوكهم. انظر: الأشخاص الذين اشتروا بورش كايين - حوالي 550 شخص (أصفر) ، ارتفعت نسبة الفتيات في المشتركين.
  • تشمل العينة مستخدمي الشبكات الاجتماعية VKontakte و Facebook و Instagram من 2010 إلى 2015. التوضيح الوحيد: هنا آلات مختارة يمكن تحديدها بأكثر من 80٪ من الدقة في الصور الفوتوغرافية باستخدام أدوات معينة.
  • لفترة معينة من الزمن ، سيارته (حسناً ، ليست ، نحن نتركها للشبكات الاجتماعية) ... لفترة معينة من الزمن ، كان الشخص يلتقط باستمرار الصور مع سيارة ، وكان معه ، كانت المنشورات مختلفة ، وكانت الصور من زوايا مختلفة ، وهلم جرا . ستكون هناك صورة أخرى ، يتم تصوير الأشخاص باستخدامها وما هي الآلات و ... نعم ، هذا هو السؤال الثاني - الثقة في بيانات الشبكات الاجتماعية.
  • منذ أن رفعناها - لسوء الحظ ، فإن البيانات على الشبكات الاجتماعية ليست صحيحة دائمًا. لا يميل الناس دائمًا لنشر معلوماتهم. أنا شخصياً أجريت هذه الدراسة: قارنت عدد الخريجين من جامعات موسكو مع عدد الأشخاص المسجلين على الشبكات الاجتماعية. في المتوسط ​​، يتم تسجيل أكثر من 60 ٪ من الناس في الشبكات الاجتماعية - تخرج خريجي جامعة ولاية ميشيغان لمدة سنة معينة في تخصصات معينة من وجودها في الواقع من حيث المبدأ. لذا نعم - هنا ، بالطبع ، هناك نسبة مئوية من الأخطاء ، ولا أحد يخفيها. هنا ، تلك السيارات التي يمكن تحديدها بأكثر من 80 ٪ من الاحتمالات تؤخذ ببساطة كأساس.

قائمة مصادر التدريب النموذجي


فيما يلي قائمة نماذج بالمصادر التي يمكن استخدامها ، والتي تُستخدم لتحديد اليقين الاجتماعي للشخص الذي هو عليه.



من الشبكات الاجتماعية نأخذ ملف تعريف ، من CIAN - تكلفة الشقة تقريبًا ، "Head Hunter" ، "Super Job" - هذا هو متوسط ​​الراتب لهذا الشخص. آمل ألا يكون هناك ممثلون عن Head Hunter هنا ، لأنهم يعتقدون أنه ليس من الجيد جدًا أخذ هذه البيانات منهم. ومع ذلك ، هذا هو متوسط ​​الراتب لمناطق معينة لأنواع معينة من النشاط الوظيفي.

Avito ، Avto.ru: غالبًا ما يكون الأشخاص ، عند إضاءة هواتفهم ، لديهم دائمًا (في عدد كبير من الحالات) شيء على الأقل على Avito ، أو Avto.ru ، أو حتى العديد من المواقع التي يمكنك من خلالها فهم من هم. إذا كنت قد بعت عربة أطفال أو سيارة على هذا الهاتف ... فإن Rosstat و USRLE لا يزالان أكثر من السجلات التي يمكنك تصنيف شركة صاحب العمل وفقًا لبعض الصيغة ، وفقًا لطراز يمكن لأي شخص طرحه (يمكنك تحديد أموال هذا الشخص تقريبًا) ور. د.).

"Tinder" يساعد على جمع البيانات عن وضع الأشخاص


بالإضافة إلى ذلك ، هناك شيء مثير للاهتمام (كخيار ، مضحك للغاية في الدراسة) - وهذا ، مرة أخرى ، هو جمع البيانات من Moscow Tinder باستخدام برامج الروبوت لهذا Tinder. تم تحديد المسافة إلى الأشخاص ، ثم تم تحديد موقعهم التقريبي.



كان الهدف من هذه الدراسة هو تحديد عدد حسابات Tinder على أراضي مؤسسات الدولة - في مجلس الدوما ، ومكتب المدعي العام ، وهلم جرا. لكنك كمعلن ، يمكنك أن تتخيل أي شيء: يمكن أن يكون ، على سبيل المثال ، ستاربكس أو أي شخص آخر ... أي عدد الأشخاص في نفس Tinder الذين يشربون القهوة منك ، ويطلبون شيئًا ما ، المخازن. فيما يتعلق بهذا الموقع الجغرافي: يمكن القيام بذلك مع أي خدمة.

الإجابة على سؤال من الجمهور:

  • "صوفان"؟ أنت لا تعرف؟ "Tinder" هو تطبيق مواعدة حيث يمكنك عرض الصور (من اليسار إلى اليمين) ، ويوضح لك هذا التطبيق المسافة إلى شخص ما. إذا حصلت على المسافة إلى هذا الشخص من ثلاث نقاط مختلفة ، يمكنك تحديد الموقع (+ 5-7 أمتار) تقريبًا. في هذه الحالة ، لتحديد إقليم مكتب المدعي العام أو مجلس الدوما ، فإنه ليس بالأمر الصعب. ولكن ، مرة أخرى ، يمكن أن يكون متجرك ، يمكن أن يكون أي شيء.

على سبيل المثال ، كان لدينا مثل هذه الحالة (وليس البحث) لفترة طويلة ، عندما تلقينا بيانات من أحد مشغلي شبكات الهاتف النقال حول كثافة التدفق ، وبيانات حول كثافة حركة النقاط الخلوية ، وتم تركيب كل هذه المعلومات على إحداثيات اللوحات الإعلانية الموجودة على الطرق السريعة. . تتمثل مهمة مشغل الهاتف المحمول في تحديد مدى مرور عدد من الأشخاص تقريبًا ويمكنهم رؤية إعلان لوحة الإعلانات هذا.

إذا كان هناك متخصصون في مجال الإعلان عن اللوحات الإعلانية ، فيمكنك القول: من المستحيل أن تفهم بشكل موثوق به - شخص يسافر ، شخص ما لم ينظر ، شخص ما بدا ... ومع ذلك ، هذا مثال على كيفية وجود 20 مليار من هذه المضلعات في موسكو التي توجد بها كثافات لهؤلاء الأشخاص كل ساعة على طرق معينة ... يمكنك رؤية ما مر به هؤلاء الأشخاص في أي لحظة وتقدير تقريبًا تدفق الركاب.

الإجابة على سؤال من الجمهور:

  • لا أحد يعطي مثل هذه البيانات. لقد أجرينا مثل هذه الدراسة لأحد المشغلين ، هذه قصة داخلية حصرية ، لذلك ، لسوء الحظ ، لم يتم تقديمها في شكل صور. ولكن في كثير من الأحيان لا تواجه وكالات الإعلان الكبيرة مشاكل في الاتصال بالمشغل. على الأقل في موسكو ، هناك العديد من السوابق عندما ، على سبيل المثال ، تتجه شركات التأمين إلى شركات مثل GetTaxi ، التي توفر بيانات مجهولة المصدر عن عمر السائق ، وكيف يقودون (جيد - سيء ، متهور - لا) ، لذلك للتنبؤ السياسات وهلم جرا. الجميع يكافحون من هذا ، لكن على مستوى داخلي لإعطاء بيانات مجهولة المصدر - أعتقد أنه لا يوجد أحد لديه مثل هذه المشكلة.

التعرف على الصور والصور


دعنا ننتقل. المفضل لدي هو التعرف على الصور. ستكون هناك قطعة صغيرة حول العثور على الأشخاص عن طريق الوجوه ، لكننا في الغالب لا نأخذ هذا الجزء.نأخذ التعرف على الأنماط والتعريفات التي في هذه الصورة هي ماركة السيارة ولونها وما إلى ذلك.



لدي مثال كوميدي:



كان هناك مثل هذه الدراسة حول البحث عن الوشم في مختلف الشبكات الاجتماعية. وفقًا لذلك ، يمكن تطبيق الشيء نفسه على أي علامة تجارية ، على أي صورة مرئية ، على أي صورة مرئية تقريبًا. هناك تلك التي لا يمكن تحديدها بشكل موثوق (لا نأخذها).



هنا هو المفضل لدي. غالبًا ما تتجه العلامات التجارية للسيارات إلى هذه المهمة ، لأن مهمتها ، على سبيل المثال ، تتمثل في العثور على جميع مالكي سيارات BMW X6 ، لفهم من هم ، وكيفية اتصالهم ، وما يهمهم وما إلى ذلك. هذا هو السؤال عن نوع السيارات التي يصورها الناس على الشبكات الاجتماعية.



لم يكن هناك أي تصفية على الإطلاق: موضوعهم ، السيارة لم تكن لهم. مجرد مثل هذا انهيار السيارات - العمر وهلم جرا. لكن يتم التعرف على الأنماط المرئية في كثير من الأحيان: هذا هو البحث عن النساء الحوامل ، والبحث عن شعارات العلامات التجارية في بعض وسائل الإعلام (من يقوم بنشر ما).



حالتي المفضلة (التي تستخدمها المطاعم المختلفة): القوائم المنشورة على شبكة اجتماعية. إنه أمر مضحك ، ولكنه في الحقيقة يتيح لك فهم الكثير من الأشياء المثيرة للاهتمام ، أولاً ، عن عملائك: من أتى إليك ولماذا فعلوا ذلك. لأنه ليس سراً أن معظم الناس (لن أقول "فتيات") في بارات السوشي يلتقطون الصور لتسجيل الدخول والتقاط الصور وما إلى ذلك.

يمكن للعلامة التجارية استخدام هذا. تهتم العلامة التجارية بنوع المنتجات التي يحتاجها لتصويرها بشكل جميل وتحميلها ، وما نوع الأشخاص الذين حضروا إلى هناك. يمكن تحريك مثل هذا الشيء مع أي شيء تقريبًا ، بدءًا من الطعام.

التعرف على الصور على الفيديو


الإجابة على سؤال من الجمهور:

  • على الفيديو - لا. لدينا في وضع الاختبار. لقد جربنا هذه التكنولوجيا ، لكن اتضح أنه ... يتعرف على الشيء كله بالفيديو جيدًا ، لكننا لم نجد أي تطبيق له. وداعا. باستثناء تحليل للمقدار الذي يقول مدونو الفيديو في مكان ما ... كانت هناك مثل هذه الدراسة. كم من الوجوه يجتمع ، كم مرة. ولكن بالنسبة للعلامات التجارية ، فإنها لم تتوصل بعد إلى معرفة أين يمكن التوصل إلى ذلك. ربما يوما ما سوف يأتي.

مرة أخرى ، هذا طعام ، يمكن أن يكون نساء حوامل ، رجال (غير حامل) ، سيارات - أي شيء.

كخيار ، كانت هناك دراسة السنة الجديدة لمنفذ إعلامي واحد. أيضا بعيدا عن الإعلان ، ولكن مع ذلك. هذا هو نوع الطعام الذي ينشره الناس عشية رأس السنة الجديدة:



لا يزال مكسور حسب العمر. يمكنك أن ترى مثل هذه العلاقة أن الشباب يطلبون في الغالب الطعام ، والكبار يصنعون في الغالب طاولة تقليدية. إنه شيء هزلي ، ولكن تخيله كمالك للعلامة التجارية ، يمكنك تقدير عدد كبير من الأشياء: من وكيف يتم التعامل مع منتجاتك ، وما يكتبون عنه. في كثير من الأحيان ، لا يشير الأشخاص دائمًا إلى العلامة التجارية نفسها في النص ، ولا يمكن أن تفهم أنظمة المراقبة التحليلية التقليدية دائمًا ما إذا كان يجب العثور على هذه العلامة التجارية فقط لأنها غير مذكورة في النص. أو في النص مكتوب مع أخطاء ، لا توجد علامات التجزئة أو أي شيء.

الصور مرئية. مع التصوير الفوتوغرافي ، يمكنك فهم ما إذا كان كائن إطار مركزي ، وليس كائن إطار مركزي. ثم يمكنك أن ترى ما كتب هذا الشخص. ولكن في أغلب الأحيان يتم استخدامه كبحث عن جمهور محتمل قاد على سيارات معينة وما إلى ذلك. وبعد ذلك سنفعل الكثير من الأشياء المثيرة للاهتمام مع هذه السيارات.

يتم تدريس الروبوتات لتقليد البشر.


في ما يلي تطبيق لعدد الأشخاص:



هناك اختلاف في مطابقة الأشخاص عندما تحتاج إلى العثور على أشخاص من بعض الصور ، وفهم ملفهم الشخصي الاجتماعي ، ومن هم. مرة أخرى ، نعود إلى السؤال التالي: إذا كانت لدينا كاميرا في متجر غير متصل بالإنترنت ، فهذه طريقة جيدة بما يكفي لفهم من يأتي إليك ومن هم هؤلاء الأشخاص وما يهمهم وما الذي جعلهم يأتون إليك.

ثم الشيء الأكثر إثارة للاهتمام: إذا قمنا بجمع حساباتهم على الشبكات الاجتماعية ، وفهم من هم هؤلاء الناس ، وما يهمهم ، يمكننا (كخيار) إنشاء روبوت مشابه لهؤلاء الأشخاص ؛ سيبدأ هذا الروبوت في العيش مثل هؤلاء الأشخاص وتحليل نوع الإعلان الذي يراه على الشبكات الاجتماعية المختلفة. سيتيح لك ذلك فهم العلامات التجارية التي تركز على هذا الشخص بدقة. هذه أيضًا قصة شائعة إلى حد ما عندما يكون من الضروري ليس فقط تحليل من هو هذا الشخص وما هي اهتماماته ، ولكن أيضًا نوع الإعلان الذي يمكن أن يستهدفه منافسونك المحتملون أو أشخاص آخرون مهتمون به.



تحليل الاتصالات في الشبكات الاجتماعية




الشيء التالي مثير للاهتمام: هذا تحليل للعلاقات بين الناس. في الواقع ، تحليل الاتصالات في الشبكة نفسها ، هذه الرسوم البيانية للشبكة - وهذا ليس قطرة على الإطلاق ، لا جديد ، والجميع يعرف ذلك.



لكن التطبيق على المهام الإعلانية هو الأكثر إثارة للاهتمام. هذا بحث عن الأشخاص الذين يحددون الاتجاهات ، إنه بحث عن الأشخاص الذين ينشرون المعلومات وفقًا لمعايير معينة داخل هذه الشبكة. لنفترض أننا مهتمون بنفس مالكي طراز BMW المعين. من خلال جمعهم جميعا ، يمكننا أن نجد أولئك الذين يحملون أيديهم الرأي العام. هذه ليست بالضرورة المدونين السيارات وهلم جرا. عادة ما يكون هؤلاء رفاقًا عاديين يجلسون في أماكن عامة مختلفة ، ويهتمون بنوع من المحتوى ، ويمكنهم ، في فترة زمنية قصيرة جدًا ، جذب علامتك التجارية أو أي شخص يهمك في منطقة المسؤولية هذه ، إلى منطقة الاهتمام.

هناك مثل هذا المثال. لدينا بعض الناس المحتملين ، والروابط بين الناس. هنا ، البرتقالي هو الناس ، النقاط الصغيرة هي مجموعات شائعة ، أصدقاء عاديون.



إذا قمت بجمع كل هذه الروابط بينهما ، يمكنك أن ترى بوضوح كبير أن هناك أشخاصًا لديهم عدد كبير من المجموعات المشتركة والأصدقاء المشتركين ، وهم موجودون فيما بينهم ... وإذا قسمنا هذا التصور إلى مجموعات وفقًا لاهتماماتهم ومحتواهم ، التي ينتشرونها ، ومدى تفاعلهم مع بعضهم البعض ... هنا يمكنك أن ترى كيف أصبحت الصورة السابقة مثل هذا:



انها تميز بوضوح لون المجموعة. في هذه الحالة ، هؤلاء هم طلاب الدراسات العليا لدينا في المدرسة العليا للاقتصاد. هنا يمكنك أن ترى أن اللون الأرجواني / الأزرق هم أولئك الذين يحبون أنصار الشفافية العالمية ، وفتح روسيا ، وجمهور خودوركوفسكي. أسفل اليسار أخضر ، أولئك الذين يحبون روسيا المتحدة.

يمكنك أن ترى أن الصورة السابقة كانت هكذا (إنها مجرد تواصل بين الناس) ، لكنها أصبحت محددة بوضوح. أي أن جميع الناس مرتبطون دائمًا ، ولديهم نفس الاهتمامات ، وهم أصدقاء مع بعضهم البعض. على رأس واحد ، أسفل الآخر ، لا يزال هناك بعض الرفاق. وإذا كان كل من هذه المخططات الفرعية الصغيرة مرئياً بشكل منفصل مع معلمات أخرى وترى سرعة توزيع المحتوى (بمعنى تقريبًا ، من يعيد نشره) ، فيمكنك أن تجد في كل جزء واحدًا أو اثنين من الأشخاص الذين يحتفظون دائمًا برأيهم العام في أيديهم ويتفاعلون معه ، ويسألون إرسال منشور من نوع ما أو أي شيء آخر - يمكنك الحصول على رد من كل هذا الجمهور المثير للاهتمام.

لدي مثال آخر من هذا القبيل. أيضًا رسم بياني: هؤلاء هم موظفو مجموعة BBDO على الشبكات الاجتماعية كمثال. يبدو وكأنه اتصال غير مهم ، كبير ، أخضر ، بينهما ...



لكن لدي خيار حيث تم بالفعل بناء المجموعات بينهما. ثم ، إذا كان أي شخص مهتمًا ، فهناك إصدار تفاعلي - يمكنك النقر فوق "رؤية".

فوق اليمين هم أولئك الذين يحبون بوتين. هنا ، البنفسجي هو المصمم. أولئك الذين مولعون التصميم ، شيء مثير للاهتمام للغاية وهلم جرا. هنا ، العناصر البيضاء هي فريق الإدارة (على ما يبدو ، كما أفهمها) ؛ هؤلاء هم الأشخاص الذين لا يرتبطون بشكل عام بأي شكل من الأشكال ، لكنهم يعملون في نفس المواقف تقريبًا. الباقي هو مجموعاتهم المشتركة وعلاقاتهم وما إلى ذلك.

لا تحتاج العلامات التجارية إلى المدونين ، بل إلى قادة الرأي


نحن نأخذ هؤلاء الأشخاص ونجد - ثم وكالة الإعلان ، تقرر الشركة الإعلانية لنفسها: يمكنها تقديم المال لهذا الشخص حتى يتفاعل بطريقة أو بأخرى مع هذا المحتوى ، أو أي شيء آخر ، أو يوجه حملته الإعلانية المحددة إليهم. غالبًا ما يتم استخدامه ، خاصة الآن ، لأن جميع العلامات التجارية ترغب في العمل مع المدونين ، فهم يرغبون في الترويج لمحتواهم ، ولا ترغب وكالات الإعلان في الاتصال (جيدًا ، يحدث ذلك).

والطريقة الحقيقية للخروج من هذا الموقف هي العثور على أشخاص ليسوا مدونين ، وليسوا مدونين للتجميل ، ولكن على سبيل المثال ، بعض المخلوقات الحقيقية التي تتفاعل مع هذه العلامة التجارية ، يمكنهم الكتابة في مكان عام بائس Mail.ru Answers ، الحصول على عدد معين من وجهات النظر. هؤلاء الأشخاص ، الذين يهتمون دائمًا بمحتوى هذا الشخص ، سينشرون الأمر برمته ، وسوف تحصل العلامة التجارية على مشاركتها.

الخيار الثاني ، كيفية استخدام تقنية مماثلة الآن ، مناسب تمامًا - هذا هو البحث عن برامج الروبوت المفضلة لدي. هذه مخاطرة في السمعة لمنافسك ، والقدرة على التخلص من الأشخاص غير الملائمين من الحملة الإعلانية وأي شيء آخر (وحذف التعليقات والبحث عن روابط بين الأشخاص). لدي مثل هذا المثال ، يحتوي أيضًا على مثال تفاعلي كبير - يمكن نقله. هذه هي صلات الأشخاص الذين كتبوا تعليقات في مجتمع Lentach.

مثال على ذلك - بحيث تفهم جيدًا وبسهولة تستطيع رؤية الروبوتات ؛ ولهذا لا تحتاج إلى أي معرفة تقنية. لذلك ، أصدر Lentach منشورًا حول تحقيق FBK حول ديمتري ميدفيديف ، وبدأ بعض الأشخاص في كتابة التعليقات. جمعنا جميع الأشخاص الذين كتبوا تعليقات - هؤلاء الناس أخضر. تحرك الآن:



الناس أخضر (من كتب التعليقات). هم هنا ، هم هنا. النقاط الزرقاء بينهما هي مجموعاتهم المشتركة ، والأصفر مشتركون مشتركون ، وأصدقاء ، وهلم جرا. هنا الجزء الأكبر من الأشخاص المتصلين. لأنه بغض النظر عن نظرية ثلاثة أو أربعة أو خمسة مصافحات ، فإن كل الناس متصلون فيما بينهم في الشبكات الاجتماعية. لا يوجد أشخاص مفصولون عن بعضهم البعض. حتى أصدقائي الاجتماعيين الذين يستخدمون فكونتاكتي حصريًا لمشاهدة مقاطع الفيديو هم جميعهم مشتركون في بعض المنشورات العامة معنا.

السائبة يستخدم أيضا السير. كل شخص لديه السير


معظم الناس (ومن هنا ، هنا) مترابطة. ولكن هناك مجموعة صغيرة من الرفاق الذين هم أصدقاء حصريًا مع بعضهم البعض. ها هم ، أخضر ، هنا أصدقائهم ومجموعاتهم المتبادلة. لقد سقطوا بشكل منفصل هنا:



ومن قبيل الصدفة ، كان هؤلاء الأشخاص هم الذين كتبوا تحت هذا المنشور: "Navalny ليس لديه دليل" ، وهكذا ، كتب نفس التعليقات. بالطبع ، لا أفترض أن أستخلص النتائج. لكن مع ذلك ، كان لدي منشور آخر على Facebook ، عندما كان هناك جدل بين Lebedev و Navalny ، قمت بتحليل التعليقات بنفس الطريقة: اتضح أن جميع الأشخاص الذين كتبوا "Lebedev - shit" ، لم يذهبوا إلى الشبكات الاجتماعية آخر مرة أربعة أشهر ، لا يتم الاشتراك في أي من الجمهور ، فجأة ذهب إلى هذا المنصب ، وكتب هذا التعليق جدا واليسار. استنتاجات ، مرة أخرى ، من هنا ، من المستحيل استخلاصها ، لكن شخصًا من فريق Navalny كتب لي تعليقًا بأنه لا يستخدم برامج الروبوت. حسنا ، حسنا!

أقرب إلى الإعلان ، أقرب إلى العلامة التجارية. كل شخص لديه الروبوتات الآن! لدينا منهم ، هناك منافسين ، وشخص آخر. يجب إلقاؤهم أو تركهم حتى يعيشوا بشكل جيد ؛ على أساس هذه البيانات (تشير إلى الشريحة السابقة) لإتقانها بحيث تبدو وكأنها أناس حقيقيون وبعد ذلك فقط استخدامها. على الرغم من استخدام الروبوتات سيئة! ومع ذلك ، قصة شائعة إلى حد ما ...

في الوضع التلقائي ، يسمح لك شيء من هذا القبيل بتصفية الأشخاص غير المناسبين للتحليل من تحليلك ، الأشخاص الذين لا ينبغي أن يكونوا في العينة ، يجب ألا يكونوا في هذه الدراسة. كثيرا ما تستخدم. مرة أخرى ، ليس كل أصحاب السيارات هم في الواقع أصحاب السيارات. في بعض الأحيان يكون من المثير للاهتمام فقط للأشخاص الذين لديهم سيارة محتملة ، والذين يجلسون في بعض المجموعات ، التواصل مع شخص ما ، لديهم جمهور معين هناك.

تحليل الحقائق والآراء


الشيء التالي الذي لدي هو المفضل لدي أيضًا. هذا تحليل للحقائق والآراء.



ذكر العلامة التجارية الخاصة بك في مصادر مختلفة أصبحت الآن قادرة على القيام بكل شيء. ليس هناك سر لهذا. ويبدو أن الجميع يعرف كيفية حساب الدرجة اللونية ... على الرغم من أنني أعتقد شخصياً أن مقياس الدرجة اللونية في حد ذاته ليس مثيرًا للاهتمام للغاية ، لأنه عندما تأتي وتقول للعميل ، "رجل ، لديك 37 ٪ محايد ، - وهو يقول ذلك" ، نجاح باهر! رائع! "لذلك ، سيكون أكثر إثارة للاهتمام الانتقال إلى أبعد من ذلك بقليل: من تقييم الدرجة اللونية إلى تقييم آراء ما يقال حول منتجك.

وهذا شيء مثير للاهتمام للغاية ، لأنه ... أعتقد شخصياً أنه من حيث المبدأ لا يمكن أن تكون هناك رسائل محايدة ، لأنه إذا كتب شخص ما شيئًا ما في الفضاء العام ، فإن هذه الرسالة تكون ملونة إلى حد ما. لذلك أنا شخصياً لم أرَ رسالة محايدة تذكر العلامة التجارية. عادة هذا هو نوع من الأوساخ.

إذا أخذنا عددًا كبيرًا من هذه الرسائل (قد يكون هناك ملايين ، 10 ملايين) ، حدد الفكرة الرئيسية من كل رسالة ، وقم بدمجها ، يمكننا أن نفهم بشكل موثوق أن الناس يتحدثون عن هذه العلامة التجارية ، ما يفكرون فيه. "أنا لا أحب العبوة" ، "أنا لا أحب الملمس" ، وهلم جرا.

ما رأيك في ترانسايرو ، تشوبا تشوبس ورئيس الولايات المتحدة


لدي مثال مثير للسخرية: هذا رسم توضيحي حول ما يمكن أن يفعله مستخدمو الشبكة الاجتماعية مع Transaero بعد إفلاسها.



هناك العديد من الأمثلة المثيرة للاهتمام: حرق ، قتل ، إرسال إلى أوروبا ، كان هناك حتى 2٪ كتبوا - "أرسلهم إلى سوريا للقيام بعمليات عسكرية". بالانتقال من شيء مثير للسخرية ، يمكن أن يكون أي علامة تجارية بشكل عملي - بدءًا من طعامي المفضل للكلاب ، وينتهي ببعض السيارات. من لا يحب التغليف ، ولا يحب الأشياء الحقيقية ، يمكنك دائمًا التعامل مع هذا ، يمكنك دائمًا حسابه. هناك عدد كبير من الأمثلة عندما غيّر الناس إنتاجهم تقريبًا ، لأنهم كتبوا في الشبكات الاجتماعية أن المصاصة ليست مستديرة بما فيه الكفاية أو أنها ليست حلوة بدرجة كافية.

لا يزال هناك مثال مثير للسخرية. تخمين ما تعليقات ومن حوله؟



لسبب ما ، هو الآن تحليل للآراء ، تحليل للحقائق التي تم تسليط الضوء عليها من الرسائل ، والتي لم يتم استخدامها بشكل كبير ، وليس على نطاق واسع. على الرغم من أن هذه التكنولوجيا ليست سرية للغاية ، إلا أنه لا يوجد أي خبرة عملية في هذا الأمر ، لأنه من تعليقات الأشخاص إلى تحديد الموضوع وتقييدهم وتجميعهم - لا تحتاج إلى أن تكون عبقريًا في علم اللغويات الحاسوبية. هذا ليس صعبا للغاية. ولكن آمل أن يبدأ الناس في العامين المقبلين في استخدامه ، لأنه ... سيكون رائعًا - إنها ردود فعل تلقائية! أنت تعرف دائما ما يقولون عنك. حسنًا ، أنت تدرك أن الأمر يتعلق برئيس الولايات المتحدة.

الإجابة على سؤال من الجمهور:

  • نعم ، هذا هو Facebook English. يتم ترجمتها إلى الروسية هنا. في مكان ما كانت مكتوبة.

Big Data


في الواقع ، لدي العديد من الأمثلة السياسية المختلفة المثيرة للاهتمام حول ترامب وعن أي شخص آخر ، لكنني قررت عدم إحضارها إلى هنا. ولكن هناك مثال سياسي واحد.

هذا هو انتخاب مجلس الدوما. متى كنت؟ العام الماضي؟ منذ ما يقرب من عام ونصف.



هؤلاء هم الأشخاص الذين تمكنوا من تحديد موقعهم بالضبط ، حتى نقطة جغرافية معينة ، من أجل فهم ما هي PEC الانتقائية التي هم فيها. وبعد ذلك فقط أولئك الذين أعربوا عن رأيهم المؤكد أخذوا من هؤلاء الناس ، والذين سيذهبون للتصويت.

من وجهة نظر التقنيات السياسية ، هذا ليس صحيحًا جدًا ، لأن الأمر برمته يحتاج إلى تطبيعه إلى الكثافة السكانية وما إلى ذلك. ومع ذلك ، فإن البلوز سوف يصوت هنا ، كما تعلمون ، من هم الذين حمراء لرفاق المعارضة ، الذين ، بالمناسبة ، لم يكن الكثير.

أنا شخصياً أعتقد أن البيانات الكبيرة لن تصل إلى التقنيات السياسية قريبًا ، لكن كخيار ، فإن المرشح هو أيضًا علامة تجارية. وهذا أيضًا ، إلى حد ما ، تحليل للحقائق والآراء حول علامتك التجارية ، وهو شيء مثير للاهتمام ، لأنه يمكنك أن تفهم في الوقت الحقيقي من يفعل ما. أعرف الآن عدة حالات من هيئة الإذاعة البريطانية (BBC) عندما راقبت شبكات التواصل الاجتماعي في الوقت الفعلي في نوع ما من البث: الرد على هذا النحو وكذا ، والكتابة عن الناس ، وطرح مثل هذا السؤال ومثل هذا - وهو بارد! أعتقد أنه سيتم تطبيقه قريبًا ، لأنه مثير للجميع.

وضع نماذج العلامات التجارية




القادم لدي النمذجة مواقف العلامات التجارية. شيء صغير ، قصير حول كيفية استخدام المقاييس المختلفة (لا يحب المشتركين في الشبكات الاجتماعية ، ولكن باستخدام مقاييس معقدة ، والاهتمام بالمحتوى ، والوقت الذي يستغرقه الحصول على المقاييس) يمكنك ترتيب العلامات التجارية.



لدي مثال على "مزرعة" لمدينة معينة. هنا ، الدوائر الدائرية الصغيرة داخلية ، ساطعة - هذا هو مقدار محتوى النص الذي تنشئه العلامة التجارية ، دوائر دائرية كبيرة - هذا هو مقدار محتوى الصورة والفيديو الذي تنشئه العلامة التجارية.

يوضح القرب من المركز مدى اهتمام هذا المحتوى بالجمهور. هناك نموذج كبير ، وهناك الكثير من أنواع المعلمات: الإعجابات ، إعادة النشر ، وقت الاستجابة ، الذين شاركوا هناك في المتوسط ​​... هنا يمكنك أن ترى: هناك "Kagocel" الرائعة التي توفر الكثير من المال لإنشاء المحتوى الخاص بك ، وبسبب هذا فهي قريبة بما فيه الكفاية إلى المركز. وهناك رفاق يقومون أيضًا بإنشاء المحتوى الخاص بهم ، لكن هذا لا يثير اهتمام الجمهور. هذا ليس مثالًا مناسبًا جدًا ، لأن كل هذه الحسابات قد ماتت تقريبًا.

يغور العقيدة أحب أكثر من بسطة




لسوء الحظ ، البقية ... من ما يجب إظهاره ... هنا ، لا يزال هناك مغني الراب الروسي ، كخيار ، من شركات حقيقية.

ما هو زائد؟ حقيقة أن الشركة تستطيع وضع أي شيء تقريبًا في مثل هذا النموذج ، بدءًا من متوسط ​​راتب المشتركين في علامتك التجارية ؛ أي نموذج يحلو لهم. نظرًا لأن كل وكالة إعلانية تعتبر المقاييس الخاصة بها بشكل مختلف ، فإن العلامات التجارية تعتبر المقاييس الخاصة بها بشكل مختلف.

يوجد أيضًا هنا واحد - Basta ، الذي يولد كمية كبيرة من المحتوى ، ولكنه موجود على الأطراف ، لأن هذا المحتوى ، على ما يبدو ، ليس ممتعًا للغاية للجمهور. مرة أخرى ، لا أفترض أن أحكم. ومع ذلك ، هناك Yegor Creed ، الذي ، وفقًا لشبكات التواصل الاجتماعي ، هو الأفضل تقريبًا في عصرنا ، وفي الوقت نفسه ينشر صوره الشخصية فقط. ومع ذلك ، لديه عدد كبير من المشتركين: هناك حوالي مليون منهم. أنا لا أتذكر المبلغ الدقيق ؛ أتذكر أن نسبة مشاركة هؤلاء الأشخاص أعلى بكثير من 85٪ ، أي أنه مقابل مليون مشترك يتلقى 850 ألف رد من هؤلاء الأشخاص الحقيقيين - هذا جنون حقيقي. هذا هو الحال.



إجابات لأسئلة الجمهور:

كم من الوقت استغرق تجميع نموذج تحليل مغني الراب؟


  • كل واحد له جمهوره المستهدف ، ومصالحه ، وهؤلاء الأشخاص يحسبون ... كل هذا طبيعي على مسافة إلى المركز تقريبًا ، وموقعه الشعاعي ليس مهمًا (لطخته فقط للتجميل ، بحيث لا يركضون مع بعضهم البعض). القرب التقريبي من المركز هو المهم فقط. هذا هو النموذج الذي نستخدمه. على سبيل المثال ، أحب الدائرة أكثر من ذلك ، شخص ما يضعها في الاعتبار نصف دائرة.
  • تم تجميع هذا النموذج بسرعة ، خلال ساعتين ، في ثلاث (نعم ، شخص واحد). هنا ، تم إدراج مقاييس حصرية: ما نضربه ونضيفه ، ثم نطبيعه بطريقة ما. يعتمد على النموذج. هناك أشخاص مهتمون بمتوسط ​​الراتب (هذا ليس مزحة) لمشتركيهم. ولهذا تحتاج إلى العثور على جهات الاتصال الخاصة بهم ، "Avito" ، كل هذا لحساب ، ضرب. يحدث ذلك ، ويستغرق وقتًا طويلاً ، ولكن على وجه التحديد (يشير إلى الشريحة السابقة) - فيما يلي بعض المعلمات البسيطة: المشتركون ، وإعادة النشر ، وما إلى ذلك. استغرق الأمر حوالي ساعتين إلى ثلاث ساعات. وفقا لذلك ، ثم يتم تحديث هذا الشيء في الوقت الحقيقي ، ويمكن استخدامه.

الآن الجزء الممتع. لدي كل شيء مع أمثلة ، لأنه ليس من المثير للاهتمام التحدث بمفرده لفترة طويلة. وآمل أن تطرح الآن أسئلة ، وسوف نتحرك أكثر من موضوع إلى آخر ، لأن لدي أمثلة على كيفية استخدام التقنيات وما إلى ذلك ...

إجابات لأسئلة الجمهور:

  • كان لدي حالة شخصية واحدة فقط مع واحدة ، إذا جاز التعبير ، okolokazino ، عندما تم وضع الكاميرا هناك ، تم التعرف على الوجوه ، وهكذا. إن النسبة المئوية للأشخاص المعترف بهم كبيرة بالتأكيد - ما لدينا ، ما لدى منافسينا. ولكن في الواقع أنها مثيرة للاهتمام بما فيه الكفاية. أرى أن هذا أمر مثير للاهتمام: يمكنك أن تفهم من هم هؤلاء الأشخاص وأن تتنبأ جيدًا لماذا أتوا إلى هنا ، وما الذي تغير في حياتهم ، وأنهم قرروا المجيء إلى الكازينو. ولكن فيما يتعلق بأنواع محددة من الأعمال ... إذا وضعت مثل هذا الشيء في صيدلية ، فلا معنى لذلك - لا يمكنك التنبؤ بالسبب وراء وصول شخص إلى صيدلية.

    كانت المهمة العالمية هنا هي بناء نموذج من أجل فهم الوقت الذي قد يرغب فيه شخص ما في الاهتمام بعلامتك التجارية ، لإعطائه إعلانًا ليس بعد أن اشترى شيئًا (كما يحدث الآن) ، ولكن لإعطائه إعلانًا "حسب التوقعات" عندما يحدث كل شيء. مع هذا "okolokazino" كان من المثير للاهتمام. هناك ، ظهرت نسبة مثيرة للاهتمام إلى حد ما من هؤلاء الأشخاص - لماذا: حصل شخص ما فجأة على زيادة ، وشخص آخر - مثل هذه الأفكار المثيرة للاهتمام. ولكن مع بعض المتاجر ، وتجارة التجزئة ، مع متجر لبعض حبوب منع الحمل ، يبدو لي أنه لن يكون على حق.

هل تستخدم البيانات الكبيرة في وضع عدم الاتصال؟


  • كان غير متصل. تحتاج فقط إلى فهم بالضبط ، تقريبا - هذا النموذج سوف تتلاقى ، لن تتلاقى. مرة أخرى ، مع مياه الصودا ... أنا مهتم حقًا بكل شيء ، لكنني شخصياً لا أفهم إلى أي مدى يمكن أن تعتمد ملفات تعريف هؤلاء الأشخاص على سلوكهم عندما يريدون شراء المياه المعبأة في زجاجات. على الرغم من أن هذا قد يكون صحيحًا ، لا أعرف.

كم عدد الحسابات المفتوحة على الشبكات الاجتماعية؟


  • لدينا 11 شبكة اجتماعية على وجه التحديد - هذه هي فكونتاكتي وفيسبوك وتويتر وأدنوكلاسنيكي وإينستاجرام وبعض الأشياء الصغيرة هناك (أستطيع أن أرى القائمة ، مثل Mail.ru وما إلى ذلك). "فكونتاكتي" لدينا بالتأكيد نسخة من كل هؤلاء الرفاق. لدينا أشخاص من فكونتاكتي - وهذا هو 430 مليون من كل الذين كانوا موجودين على الإطلاق (منهم حوالي 200 مليون ينشطون باستمرار) ؛ هناك مجموعات ، وهناك اتصالات بين هؤلاء الأشخاص ، وهناك محتوى يثير اهتمامنا (نص) وجزء من وسائل الإعلام ، لكنه صغير جدًا ... بشكل عام تقريبًا ، ننظر إلى هذه الصورة: إذا كانت هناك وجوه ، فإننا ننقذها ، إذا كانت الميمات التي نستخدمها نحن لا نحفظ ، لأنه حتى معنا ، لن يكون هناك ما يكفي لحفظ محتوى الوسائط.

    هناك الفيسبوك باللغة الروسية. في مكان ما الآن 60-80 ٪ من Odnoklassniki ، في غضون شهرين ربما سنصلهم جميعا إلى النهاية. الروسية "Instagram". لكل هذه الشبكات الاجتماعية ، هناك مجموعات ، أشخاص ، روابط بينهم وبين النص.
  • حوالي 400 مليون شخص. هناك دقة: هناك أشخاص ليس لديهم مدينة (يحتمل أن تكون روسية / غير روسية) ؛ منهم في المتوسط ​​على الشبكات الاجتماعية ، وهنا - على فكونتاكتي - 14 ٪ من الحسابات المغلقة ، لا أعرف الرقم الدقيق على Facebook.
  • على Instagram ، لا نحفظ الوسائط - فقط إذا كانت هناك وجوه هناك. نحن لا نحفظ هذا المحتوى (الآخر) من الوسائط. عادة مثيرة للاهتمام: مجرد نص ، والتواصل بين الناس. هذا كل شئ. أبحاث Instagram الأكثر شيوعًا هي البحث المعتاد من قِبل الجمهور: من هم هؤلاء الأشخاص ، مثل الشيء الأكثر أهمية هنا هو ربط هؤلاء الأشخاص بالشبكات الاجتماعية الأخرى. ابحث عن الملف الشخصي لهذا الشخص في فكونتاكتي وفيسبوك من أجل حساب عمره وما إلى ذلك.
  • حتى الآن ، ليست هناك حاجة لاتخاذ أي شخص آخر - ببساطة لأنه لا يوجد عملاء. فيما يتعلق باللغة: لدينا الروسية والإنجليزية والإسبانية ، ولكن لا يزال يستخدم حتى الآن حصريًا لماركات من روسيا ؛ حسنا ، أو الشركات التي تقودهم من روسيا.
  • كل يوم نقوم بمقابلة أشخاص في الكثير والكثير من التدفقات: نقوم بجمع البيانات من خلال جمع الويب ، ونحن نقوم بتحديث هذه المؤشرات باستخدام Api. في غضون 2-3 أيام ، يمكنك المرور عبر فكونتاكتي بأكملها ، بعد مسحها ضوئيًا ؛ في مكان ما خلال أسبوع ، يمكنك الاطلاع على Facebook بالكامل ، مع إدراك من قام بتحديثه ، وما هو غير ذلك. ثم يجب إعادة تجميع هؤلاء الأشخاص بشكل منفصل: ما الذي تغير بالضبط ، لكتابة هذه القصة بأكملها. في ذاكرتي ، من النادر جدًا أن تستخدم بعض المهام العملية الحقيقية ملف التعريف القديم لشخص ما على الشبكات الاجتماعية. كان هذا هو الوقت الذي اقترب فيه أحد السياسيين ، وكانت مهمته فهم نوع الأشخاص الذين جاءوا إلى المقر ، والذين كان هؤلاء الأشخاص منذ 6-8 أشهر (لم يحذفوا ملفهم الشخصي ، ولكن في الواقع لمرشح آخر ، جاءت بطاقات الاقتراع يفسد).

    بضع مرات - قصص شخصية عندما يتم نشر صور شخص ما علنًا. كان من الضروري العثور على اتصالات ، وما إلى ذلك. للأسف ، إنه أمر مثير للشفقة للغاية ، لكن لا يمكننا الشهادة في المحكمة ، لأن قاعدتنا غير سائلة من الناحية القانونية.
  • مستودع MongoDB هو المفضل لدي.

الشبكات الاجتماعية تكافح مع جمع البيانات


  • عادة ، نحن المعلنون نفرغ فقط من قائمة هذه الحسابات ، ثم يستخدمون المعيار ... أي على الشبكات الاجتماعية ، في فكونتاكتي هناك ، يمكنك تحديد قائمة بهؤلاء الأشخاص.

    ولكن بالنسبة إلى Facebook ، يتم استخدام ملفات تعريف الارتباط المشتراة. نحن لا نعمل مع ملفات تعريف الارتباط ، ولكن كانت هناك العديد من القصص عندما أعطى المعلن نفسه بعض الأشخاص ، وتفاعلنا معهم - لديهم هذه الشبكات ، مع إعلانات دعائية وغير دعائية ، وملفات تعريف الارتباط هذه. يمكنك ربط - لا شك! لكنني لا أحب هذه الأشياء حقًا ، لأنني أعتقد أن هذا غير موثوق به للغاية. إنه محض في رأيي ، فهو مثل TNS ، الذي "يبث" أجهزة التلفاز - ليس من الواضح ما إذا كنت تشاهد هذا التلفزيون ، لا تشاهده ، تغسل الأطباق أثناء عمل جهاز التلفزيون ... والشيء نفسه هنا: غوغل غالبًا شيء ما: الإنترنت ، لكن هذا لا يعني أنني أريد شرائه.
  • إذا كنت تستخدم شبكة قياسية من نوع ما من الإعلانات السياقية: فقد كان لدي العديد من القصص عندما قمنا بإفراغ هؤلاء الأشخاص لهم ، وحاولت استخدام واجهاتهم لربطهم بـ "ملفات تعريف الارتباط" على مواقعهم. لكنني لا أحب هذه الأشياء حقًا.

الإنترنت رواتب المستخدمين الصيغة


  • الصيغة العامة لمتوسط ​​الراتب: هذه هي المنطقة التي يعيش فيها الشخص ، هذه هي فئة الأعمال التي يعمل فيها (أي الشركة التي يعمل فيها صاحب العمل) ، ثم يتم شغل منصبه في هذه الشركة ، ومتوسط ​​الراتب في هذا المنصب ... متوسط ​​الراتب مأخوذة من Head Hunter و Super Job (وهناك العديد من المصادر الأخرى) لشغل وظيفة معينة في منطقة معينة وفي سياق عمل معين.

    مع Avito و Auto.ru ، عادةً ما تؤخذ معلمات إضافية إذا قام شخص ما بإضاءة الهاتف. مع Avito ، يمكنك رؤية الأشياء التي يبيعها الشخص - باهظة الثمن وغير مكلفة وغير مستعملة وغير مستعملة. مع "Auto.ru" ، يمكنك معرفة ما إذا كان لديه سيارة - يمتلكها ، لا يملكها. هذا في مكان ما أقل من 20٪ من الأشخاص الذين أسقطوا هواتفهم عن طريق الخطأ في مكان ما ، ويمكن ربط حساباتهم بهذه البيانات.

ما حجم شركة جمع البيانات؟


  • حجم الصور المخزنة في بيتابايت هو 6.4. لا يمكنني القول على وجه اليقين معدل النمو في الوقت الحالي ، لأننا بدأنا في عام 2016 في تسجيل المناظير وبدأنا في تسجيل الفيديو قليلاً.

    لا أستطيع أن أقول بالضبط متى كان الصفر. لقد انتقلنا من شركة إلى أخرى - كل هذه قصص طويلة. لكن يمكنني القول أن VK و Facebook و Instagram و Twitter - كل هذا النشاط التجاري (الأشخاص والمجموعات والروابط بينهم) مع النص والمحتوى - هذه ليست في الواقع بيانات كثيرة ، إنها بالكاد مجرد بيتابايت التقطت. أعتقد أن هذا غيغابايت من 700 ، وربما 800.

مساعدة العملاء على تحديد مكانة الحالية ، حيث "حفر"؟


  • عندما يصل العميل ، نخبره بمثل هذه الأشياء ، لكننا ، مثل Google Trends ، لا نفعل هذه الأشياء.
  • كان لدينا العديد من القصص شبه الاجتماعية ، مع تاريخ انتخابي قبل الانتخابات - قمنا بتحليل كل هذا. مع العلامات التجارية وتقييم الآراء حول العلامات التجارية ، يتفق كل شيء دائمًا تقريبًا. فيما يلي قصص الانتخابات الانتخابية - لا (مع تقييم المرشح الذي يجب أن يفوز). حسنًا ، من الخطأ هنا - نحن ، أو أولئك الذين يؤمنون بـ VTsIOM - لا أعرف.
  • عادةً ما نأخذ نتائج التحكم هذه من العلامة التجارية نفسها ، وتأخذها من الرفاق الذين يطلبون البحث - الهاتف هناك ، والتسويق ، وما إلى ذلك. بالإضافة إلى ذلك ، يمكن التحقق من هذا الأمر بالكامل من خلال الأشياء الأساسية: أجاب شخص ما على الرسالة الإخبارية هناك ، واستطلاعات رأي شخص ما ... إذا كانت هذه علامة تجارية كبيرة (Coca-Cola ، على سبيل المثال) ، فيجب أن يكون لديهم مليون أو اثنين من مراجعات العملاء الداخلية - هذه ليست فقط تعليقات على الشبكات الاجتماعية وأي آراء ؛ بعض الأنظمة الداخلية ، والاستعراضات ، وهلم جرا.

القانون لا "يعرف" ما هي البيانات الشخصية!


  • نحن نحلل مصادر البيانات المفتوحة حصريًا ؛ ولا نتسلق أبدًا إلى أي chernukha القذرة. يعتمد نموذجنا على حقيقة أننا نقوم بتخزين جميع البيانات المفتوحة في بعض مراكز البيانات العامة ، ونؤجرها في مكان آخر ، ونحللها في المنزل ، في منطقة المكاتب ، في خوادمنا ، وهذا لا يتجاوز أي مكان خارج المنطقة.

    لكن تشريعات البيانات المفتوحة لدينا غامضة للغاية.

    ليس لدينا فهم واضح لماهية البيانات المفتوحة ، وما هي البيانات الشخصية - يوجد هذا القانون الفيدرالي 152 ، ولكن على أي حال ... يفكرون كيف؟ الآن ، إذا كان لدي اسمك وهاتفك في قاعدة بيانات واحدة ، فلدي هاتفك وبريدك الإلكتروني في قاعدة بيانات أخرى ، وفي قاعدة البيانات الثالثة ، على سبيل المثال ، بريدك الإلكتروني وسيارتك ؛ كل هذا يشبه البيانات غير الشخصية. إذا قمت بتجميعها جميعًا ، فيبدو أن القانون سيصبح بيانات شخصية.

    نلتف حول هذا بطريقتين. أولاً ، وضعنا الخادم مع البرنامج للعميل ، ومن ثم لا تتجاوز هذه البيانات منطقته ، ومن ثم يكون العميل مسؤولاً عن نشر هذه البيانات الشخصية ، وليس البيانات الشخصية ، وما إلى ذلك. أو الخيار الثاني: إذا كان هذا هو نوع من القصة حيث يجب عليك مقاضاة الشبكة الاجتماعية أو أي شيء آخر ...

    أجرينا مثل هذه الدراسة عندما جمعناها (كانت الانتخابات التمهيدية لروسيا المتحدة) لحساب LifeNews لهؤلاء الرفاق وشاهدنا أي نوع من الصور الإباحية يحلو لهم. كان الشيء المضحك ، ولكن مع ذلك. نحن نبيع هذا باعتباره رأينا الشخصي الخاص ، دون الكشف القانوني في المستندات التي قمنا بتحليلها - السجل والراتب والشبكات الاجتماعية ؛ نبيع رأي الخبراء ، وهناك بالفعل على الهامش نوضح للشخص ما قمنا بتحليله وكيف.
    كان هناك العديد من القصص ، لكنها ارتبطت ببعض المشاريع التجارية العامة. على سبيل المثال ، لدينا مشروع مجاني غير ربحي لأولئك الذين يركبون ألواح طويلة (مثل هذه اللوحات طويلة): كانت المهمة هي جمع منشورات الأشخاص - عندما ينشر شخص ما ، "ذهبت إلى حديقة غوركي لركوبها." وبعد ذلك يجب أن يحصل على الخريطة ، ويمكن للأشخاص من حوله أن يروا أن هناك شخصًا ما بجواره. قضى VK وقتًا طويلاً في القتال معنا حول هذا الموضوع ، لأنهم لم يعجبهم أن ننشر هذه المعلومات دون إذن من الأشخاص. لكن الأمر لم يتم طرحه على المحكمة ، لأننا ضمن العديد من المجتمعات الكبيرة أضفنا إلى القواعد التي يمكن أن تستخدمها وكالات ووكالات وتحليلات تابعة لجهات خارجية ، وما إلى ذلك. بالطبع ، لم تكن أخلاقية بشكل خاص ، ولكن مع ذلك.
  • لقد وقعنا فجأة وبدأنا في بيع رأي الخبراء لدينا.

هل تعمل مع المؤسسات التعليمية؟


  • نحن نتعاون مع التعليمية ، نعم. لدينا سلسلة كاملة: لدينا برنامج ماجستير في المدرسة العليا ، ونتعاون مع جامعات أخرى. الجامعات التي نحبها حقًا!
  • هناك جهات الاتصال الخاصة بي - يمكنك الكتابة. وإشارة إلى العرض التقديمي ، إذا كان أي شخص مهتمًا - فهناك كل هذه الأمثلة ، يمكنك التحرك.
  • إذا كان الهاتف معروفًا ، فإن البريد هو الخيار المطلق تقريبًا ، ولن يقوم أي شخص بإزالته. إذا لم يكن هناك هاتف ، فعادة ما تكون هذه صورة ، ولا توجد صورة - هذه هي السنة ، ومكان الإقامة ، والعمل. وهذا هو ، بحلول العام ، مكان الإقامة والعمل تقريبا كل شيء يمكن دائما تحديدها بمهارة. ولكن هذا ، مرة أخرى ، هو سؤال حول المهمة.

    لدينا ، على سبيل المثال ، عميل يبيع تلفزيون الإنترنت. اشترى شخص ما اشتراكًا في Games Of Thrones هذه ، والمهمة هي العثور على هؤلاء الأشخاص من CRM الخاص بهم على الشبكات الاجتماعية ، ثم البحث عن أشخاص محتملين من منطقة نفوذهم. أنا فقط أقول أن لديهم ، على سبيل المثال ، اسمًا ولقبًا وبريدًا إلكترونيًا ... ومن ثم يصعب جدًا القيام بشيء ما. يمكنك العثور على أشخاص في معظم الحالات عن طريق البريد الإلكتروني.
  • بالنسبة للأصدقاء ، عادة ما "نربط" الأشخاص بالشبكات الاجتماعية ، لكن هذا ليس صحيحًا دائمًا. ليس هذا ليس صحيحًا دائمًا - إنه لا يعمل دائمًا. أولاً ، يتطلب هذا الكثير من العمل ، لأن هذه العملية (لمطابقة الأشخاص) يجب تنفيذها أولاً لكل من الأصدقاء - لفهم ما إذا كانوا قد تحولوا من الشبكات الاجتماعية أم لا. ومن ثم - لأنه لا أحد حقيقة غير معروفة أن "فكونتاكتي" لدينا صديق واحد ، في "Facebook" لدينا أصدقاء آخرين. ليس للجميع ، ولكن بالنسبة لي ، على سبيل المثال ، من هذا القبيل ؛ .

?


  • . , , . NDA. , , , , – , , . , – , – .

?


  • , , , – , , – . , , , – Social Data Hub, . . , , , , . , …
  • ( ?) , , .
    ( ): , , .
  • «» – 14%, «» ( ). , – .

, !


  • , – . , «». , , … , ! - – , . – , . , , …

    - : «, - ! !» , .
  • , – , , … , , 5 , - . , HR-, , : « – »!

. ?


  • -10 . : … – , HR- , . , , - …
  • ( ) 25 , .
  • , , , 50 %. , - . , 40 , 50-60 % . . , - , , - , , … , – , . .


قليلا من الإعلان :)


شكرا لك على البقاء معنا. هل تحب مقالاتنا؟ تريد أن ترى المزيد من المواد المثيرة للاهتمام؟ دعمنا عن طريق تقديم طلب أو التوصية لأصدقائك VPS المستندة إلى مجموعة النظراء للمطورين من 4.99 دولار ، وهو تمثيلي فريد من الخوادم على مستوى الدخول التي اخترعناها لك: الحقيقة الكاملة حول VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps من 19 $ أو كيفية تقسيم الخادم؟ (تتوفر خيارات مع RAID1 و RAID10 ، ما يصل إلى 24 مركزًا وما يصل إلى 40 جيجابايت من ذاكرة DDR4).

Dell R730xd أرخص مرتين في مركز بيانات Equinix Tier IV في أمستردام؟ فقط لدينا 2 من Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 جيجا هرتز 14 جيجا بايت 64 جيجا بايت DDR4 4 × 960 جيجا بايت SSD 1 جيجابت في الثانية 100 TV من 199 دولار في هولندا! Dell R420 - 2x E5-2430 سعة 2 جيجا هرتز 6 جيجا بايت 128 جيجا بايت ذاكرة DDR3 2x960GB SSD بسرعة 1 جيجابت في الثانية 100 تيرابايت - من 99 دولارًا! اقرأ عن كيفية بناء البنية التحتية فئة باستخدام خوادم V4 R730xd E5-2650d تكلف 9000 يورو عن بنس واحد؟

Source: https://habr.com/ru/post/ar482648/


All Articles