عُقد مؤتمر البيانات الضخمة ، لقاء الأخ الأكبر ، الذي نظمته مؤسسة Sistema_VC ، في موسكو. كان كل شيء موجودًا: وصل مطور إسرائيلي يعرف كيفية معالجة البيانات أسرع مائة مرة من أي شخص آخر. قالت MTS أن MTS ستموت إذا لم تصبح شركة تكنولوجيا معلومات. كان رجال الأعمال الروس يدقون ناقوس الخطر ، محاولين تبديده.

يبدو أن الجميع معتادون بالفعل على حقيقة أنه في المحادثات حول البيانات الضخمة ، خاصة إذا كانت فلسفية ، سيظهر عاجلًا أو آجلًا الأخ الأكبر أورويليان الأخ الأكبر - تمامًا مثل هتلر
في جميع النزاعات على الإنترنت . لم يسحب المنظمون ويضربون الختم على الفور في العنوان. القلق - مبرر أم لا - هو جزء من الضجيج ، وماذا تفعل.
في الواقع ، كانوا يحلمون بالتاريخ الكبير من العصور القديمة - من جميع أنواع المصريين القدماء ، عندما تم إعادة كتابة الناس لفهم كيفية استخدامها بشكل أكثر فعالية. في عهد بيتر الأول ، تم جمع البيانات الضخمة (تعداد لجمع الضرائب) لمدة ثلاث سنوات ، ثم تمت معالجتها لمدة ثلاث سنوات أخرى. الآن ، باستثناء هذه العملية ، أضفنا الأسلاك والسرعات وأنواع البيانات بأنفسهم. كل ذلك باسم الكفاءة والتحسين وحلم أقدم للبشرية - بحيث يصبح كل شيء بطريقة ما عصاميًا.
تحلم الشركات بأن يتم تقسيم كل شيء بشكل واضح ، ويجب تحديد من وماذا ومتى يتم البيع. يريد المشترون شراء كل شيء وتشغيله ومضغه وهضمه. في المؤتمر ، تجمع الأشخاص الأذكياء لمناقشة كيفية تحقيق ذلك. لقد استمعت إليهم بذكاء ، وسألتهم وكتبت كل شيء.
يورغان Calllebout وعلم النفس في البيانات الضخمة

بدأ المؤتمر بكلمة أخصائي علم النفس يورجان كالليبوت. يعمل في DataSine. بمساعدة التعلم الآلي والنماذج النفسية ، يقسمون الجمهور ويدرسون من يحتاج إلى عرض الإعلانات.
إنها تعمل على هذا النحو: إنهم يجمعون جميع البيانات التي يجدونها - من السجلات على الإنترنت إلى تاريخ المدفوعات - وبمساعدة التعلم الآلي ، يقومون بتثبيتها على النموذج النفسي للخمس الكبار.
الانبساط - الانطواء
الحجز - العزل
ضبط النفس - الاندفاع
عدم الاستقرار العاطفي - الاستقرار العاطفي
التعبيرية - التطبيق العملي
يزعم Yorgan أن النقطة الرابعة لا تستخدمها شركتهم ، لأنها ليست أخلاقية. وبحسب ما زُعم ، يمكننا أن نستنتج بشأن الصحة العقلية لشخص ما واستخدامها ضده.
بالطبع ، يستنتج الشخص طرق التوزيع ، وإذا لم يكن عميقًا ، تبدو نمطية إلى حد ما. على سبيل المثال ، يقول Yorgan أنه إذا اشتريت الكثير من الكتب ، فأنت على الأرجح انطوائي. إذا كنت غالبًا ما تنفق المال في الحانات - ربما منبسط (لأن الانطوائيين يجلسون في المنزل ويصمتون).
إلى السؤال "لماذا آخر ؟!" يورغان لديه استجابة طبية. الشيء هو هرمون أستيل كولين ، الذي يتمتع به جميع الناس بدرجات مختلفة من الحساسية. إذا كان الشخص حساسًا للهرمون ، فإنه يصبح انطوائيًا ، وبانبعاثات قوية من التفاعل مع الناس ، على سبيل المثال ، فإنه يغلق في كتلة ويبتلع اللسان. المنفتحون لديهم عتبة أعلى لتحفيز الهرمونات. لذلك ، قد لا يزعجهم الحشد والضوضاء والتواصل لبعض الوقت.
لا يتناثر الهرمون على مرأى الناس فقط ، بل يتفاعل مع أشياء كثيرة - الألوان والأصوات والكلمات. لذلك ، بالنسبة للانبساطيين والانطوائيين ، يقوم فريق Yorgan بعمل رسائل إعلانية مختلفة.
على سبيل المثال ، نستخدم نفس الأرقام والحقائق ، لكننا نرتب الحروف في القائمة البريدية بطرق مختلفة. بالنسبة للانبساطيين ، نضع صورًا برتقالية مشرقة. للانطوائيين والأزرق والبرد. يساعدنا التعلم الآلي في اختيار هذه الصور. من حقيقة أنك قمت بتغيير صورة واحدة في البريد الإلكتروني ، يزيد عدد النقرات على الرابط بنسبة 40٪. إذا قمت أيضًا بتكوين النص ، فستزداد المعاملات إلى 80٪.
عندما سئل يورغان بقلق عما إذا كان إدخال البيانات الضخمة سيحولنا جميعًا إلى انطوائيين ، أجاب لا ، لن يفعل. كيف ولدت ، لذلك سوف تكون.
ولكن كان هذا هو أكثر الأسئلة إثارة للقلق. ذهب الباقي في الكلاسيكيات - ولكن لن تبدأ الشركات في التلاعب بنا بهذه الأدوات النفسية الخاصة بك؟
لم تصل العديد من الشركات إلى المستوى الذي يمكنهم فيه استخدام البيانات الضخمة ، ناهيك عن التلاعب بشخص ما بمساعدتهم. وبشكل عام ، لن نتلاعب بك. لا نريد إجبارك على فعل شيء ضد إرادتك. نحن نخصص العروض فقط بحيث يكون الجميع سعداء.
عامي جال وقاعدة بيانات سرعة GPU

جاء عامي جال ، مؤسس SQream ، من تل أبيب إلى المؤتمر. تعمل شركته على تطوير قاعدة بياناتها ، والتي ، وفقًا للبيان ، أسرع 100 مرة من المعتاد بسبب معالجة طلبات GPU. هذا يجعلها مناسبة للعمل مع البيانات الضخمة.
من الأمثلة ، تحدث عامي عن حالة المركز الإسرائيلي لأبحاث السرطان. هناك قاعدة بيانات عن علاج آلاف المرضى لعقود ، وهناك عينات من جينات كل مريض ، ومعلومات عن جميع الحالات الشاذة ، وردود الفعل ، وبطبيعة الحال ، نجاح علاج معين.
من خلال تجميع مجموعات البيانات الضخمة ، تعلم العلماء تحديد أكثر طرق العلاج المناسبة إحصائيًا لكل مريض جديد. كانت المشكلة أنه يمكن أن يكون هناك ما يصل إلى 6 مليارات سجل في عمود واحد فقط من هذا الجدول. في السابق ، استغرق التحليل شهرين - الآن يستغرق ساعتين.
أي بمجرد أن يتلقى العلماء عينة من الحمض النووي للمريض ، فإنهم يعرفون على الفور الطريقة التي من المرجح أن تؤدي إلى النجاح.
كنت مهتمًا بمعرفة المزيد عن عامي وشركته وتقنيته ، لذلك سألته عن كل شيء شخصيًا.

درس عامي علوم الكمبيوتر والفيزياء في جامعة تل أبيب ، ثم عمل كمبرمج ، وفي عام 1996 أسس أول شركته. ووفقا له ، لم يكن الأمر مثل الحياة اليومية الحديثة للشركات الناشئة في مجال التكنولوجيا: "كان علينا أن نفعل شيئًا ونبيعه على الفور للعملاء من أجل البقاء".
في عام 2000 ، أسس Magic Software مع الشركاء. هناك تولى آمي منصب المدير الفني ونائب رئيس البحث والتطوير ، ولكنه انتقل تدريجيًا من التكنولوجيا إلى الأعمال - "انتقل إلى الجانب المظلم".
بعد مغادرة Magic بعد ثلاث سنوات ، بدأت Ami في الاستثمار في الشركات الناشئة. يضحك قائلاً: "إذا كانت الشركات الناشئة تعتمد على الأقارب والأصدقاء والأغبياء ، فعندئذ كنت واحدة من الأخيرة".
وأخيرًا ، في عام 2010 ، إلى جانب مهاجر روسي ، Kostya Varakin ، توصل Ami إلى فكرة تسريع قواعد البيانات باستخدام GPU وأسس SQream.
- عندما ظهرت الفكرة ، لم يكن هناك إحساس مثل "نعم ، هذا واضح! لماذا لا يزال أحد يعالج استعلامات SQL على وحدة معالجة الرسومات؟ "اليوم واضح. ولكن عندما بدأنا ، لم يرغب أحد في الاستماع إلينا. بدا للجميع أن هذا مستحيل.
جاءت الفكرة لشريكي المؤسس المشارك Kostya Varakin من سانت بطرسبرغ. لكنها بدت مستحيلة لدرجة أنه لم يقرره على الفور. وفكرت - استخدام GPU ليس للألعاب ، ولكن لمعالجة البيانات - إنه أمر رائع. بدأنا العمل ، ووضع هذا النهج في قلب الشركة.
بالطبع ، كنا نعتقد أن GPUs رائعة للبيانات ، وسيبدأ الجميع في استخدامها هناك. لكنهم لم يبدأوا. أتذكر عندما أردت زيادة الاستثمارات ، كان رد فعل رجال الأعمال على هذا النحو: "هل تمزح؟ معالجة بيانات GPU؟ هذا لا يحدث ، ارحل ".
بعد ست سنوات فقط (قبل عامين إلى ثلاثة أعوام تقريبًا) أصبحت وحدة معالجة الرسومات سائدة بفضل عملها مع AI ، التعلم الآلي العميق. وبالطبع ، توقفت الآن معالجة البيانات على وحدة معالجة الرسومات لتبدو وكأنها فكرة غريبة.
"ألم يرى الأشخاص الذين اقترحت الفكرة السرعة؟"رأيت ، رأى الجميع. لكن الحقيقة هي أن GPUs مصممة للعمل مع الرسومات المتجهة. والطريقة التي نعالج بها البيانات هي عكس العمل مع الناقل. الشريحة غير مصممة لهذا النوع من الحسابات. لذلك ، مع البرامج ، يجب أن نجعل المعالج يعتقد أنه يعالج ، على سبيل المثال ، الفيديو ، على الرغم من أن الأمر ليس كذلك. أي ، عليك تحويل كل شيء قبل وبعد GPU ، لأنه يقبل المتجه فقط.
كان علينا أن نتعامل مع مشاكل معقدة وتقسيمها إلى قوائم تعليمات بسيطة للمعالج. لكنها بدت شبه مستحيلة.
- وما هو الأصعب في تطويره؟العمل مع الروس (يضحك). في الواقع ، لم يكن الحل الأصعب في تاريخ الشركة هو الحل. في البداية ، خططنا لتطوير مسرع فقط لقواعد بيانات الآخرين. شيء من شأنه تسريع Oracle ، MS SQL. لنفترض أننا أرسلنا طلبًا إلى Oracle وتعمل بشكل أسرع بفضل GPU.
دخلنا السوق بالسؤال: "هل تحتاج إلى شيء يجعل قاعدة بياناتك تعمل بشكل أسرع 20 مرة"؟ وأجاب السوق: "لا ، لا حاجة".
كانت المشكلة أننا اعترضنا الطلب بين المحرك والعميل. كان هذا تداخلاً مع Oracle. قيل لنا: "هذا مستحيل - أرسل طلبًا إلى المحرك الخاص بك وقم بمعالجته بنفسك". ونقول: "ليس لدينا قاعدة بيانات".
"لذا افعلها."
نظرنا في كيفية عمل الشركات الأخرى ، وكيفية ترتيب مستودعات البيانات مع بنية MPP. يتم إنشاؤها جميعًا على أساس قاعدة بيانات أخرى - بشكل رئيسي PostgreSQL أو MySQL. تم بناء كل من Vertica و Greenplum والمستودعات القديمة الأخرى حول PostgreS.
قررنا أن نجربها أيضًا. أخذوا PostgreSQL ونفذوه على وحدة معالجة الرسومات. اتضح ببطء شديد: زادت السرعة مرتين فقط. لا أحد سيترجم قواعد البيانات على وحدة معالجة الرسومات من أجل التسريع في حوالي مرتين. لم نكن نعرف ماذا نفعل ولم ننام لمدة أسبوع. مع كل الاحترام الواجب لي ولزملائي ، لم نتمكن من بناء قاعدة بيانات من الصفر - وهذا مشروع كبير للغاية.
لكننا حاولنا ، وبعد بناء الكتلة الأولى ، زادت الإنتاجية 18 مرة. ثم قررنا الاستمرار ، على الرغم من أننا علمنا أن الطريق سيكون طويلًا وصعبًا. اتضح أن هذا القرار هو الأكثر صعوبة طوال الوقت. بعد كل شيء ، هذا يعني أننا سنحتاج إلى المزيد من المال والناس والوقت لبناء شركة.
بالحديث من وجهة نظر تقنية ، كان الأصعب بدء تشغيل JOIN باستخدام GPU بين جدولين كبيرين على القرص.
- ما هو مجموعك؟نستخدم CUDA للعمل مع GPU. نكتب كل شيء بلغة C ++ و Haskell وقليلاً في Erlang.
عندما تعمل مع مليارات المعاملات لفترة معينة من الوقت ، على سبيل المثال ، في جزء من الثانية ، تحتاج إلى شيء قريب جدًا من الأجهزة.
ننتقل من المجمع إلى كودا وإلى C ++. إذا أضفت شيئًا آخر على طول الطريق ، فستنخفض السرعة بالفعل ، لذلك نحتاج إلى أن تكون منخفضة قدر الإمكان. لقد حاولنا العمل مع منصات أخرى: على سبيل المثال ، استخدمنا OpenCL بدلاً من Cuda ، ولكن كل هذا لم يكن جيدًا بشكل جيد ، وسارت العملية ببطء شديد.
نحن بحاجة إلى التعمق قدر الإمكان حتى تكون الإنتاجية عالية.
لهذا نستخدم لغات برمجة مثل C ++ ، Haskell ، Cuda. في بعض النقاط ، نقوم بتطبيق Erlang ، ولكن هذا يحدث كثيرًا أقل - نستخدم نفس C ++ أكثر وأكثر.
- إذا كنت أعمل فقط مع قواعد البيانات العادية ، في حالة التحول إلى قواعد البيانات الخاصة بك ، فهل يجب علي إعادة التدريب؟من وجهة نظر اللغة ، ليست هناك حاجة لتعلم أي شيء جديد. إذا كتبت في SQL ، فسيكون كل شيء كما هو هنا. هناك أشياء تعمل بشكل مختلف. لكن المواصفات تصف جيدًا كيفية إعداد كل شيء.
- التسارع المعلن 100 مرة هو الحد الأقصى الذي يمكنك الضغط عليه من GPU؟لا أعتقد أن شركتنا وصلت إلى 10٪ من الممكن. بالفعل في سبتمبر سنطلق الإصدار الثالث من المنتج ، حيث سنضاعف الإنتاجية. في المستقبل نخطط لزيادة هذا العدد أكثر فأكثر. أداء وحدة المعالجة المركزية منذ عام 2006 لا يكاد ينمو ، وكمية البيانات تنمو باطراد. أداء GPU ينمو بنفس الطريقة.
اتضح أننا في بداية دورة الحياة. أحد الأشياء التي نخطط لها قريبًا هو زيادة الأداء ليس فقط على وحدة معالجة رسومات واحدة ، ولكن أيضًا العمل على عدة. فقط تخيل السرعة التي ستكون عليها! هنا طلب يدوم 100 ثانية. نقوم بتقسيمها إلى عدة وحدات صغيرة بين عشرة وحدات معالجة رسومات - ويمر الطلب في الحال.
أعتقد بشكل عام أننا على وشك حقبة جديدة عندما تصبح حوسبة GPU مهيمنة في معالجة البيانات.
"لماذا لا يزالون؟" ماذا يتوقف؟الكثير من ذلك. يمكنني تسمية ثلاث عقبات.
الأول ليس قوياً كما كان من قبل ، ولكنه لا يزال قائماً. عندما نأتي إلى الشركات التي تعمل مع Oracle أو IBM ، فسيكون أمامهم خيار - انتقل إلى شركة ناشئة صغيرة من تل أبيب أو البقاء مع لاعب كبير. حتى إذا تم حلها ، فإن هذه العملية تتأخر إلى حد كبير.
الحاجز الثاني هو قلة الناس. تل أبيب هي وادي سيليكون صغير. تتمتع إسرائيل بمنافسة شديدة للغاية بالنسبة للموظفين: يستغرق الأمر ثلاثة أشهر للعثور على الموظف المناسب ، على الرغم من أنني بحاجة إليه في ثلاث ثوانٍ.
وأخيرًا ، ثالثًا - بصفتي مالكًا لشركة تكنولوجيا ، يمكنني القول أنه يوجد دائمًا شخص أكثر ذكاءً منك وأكثر من ذلك بكثير. علينا باستمرار التأكد من أن التكنولوجيا في ذروة الفرص ، والكثير للاستثمار فيها.
- ألا يبدو لك أن وحدة معالجة الرسومات لا تزال "عكازًا" ، وبالنسبة للبيانات ، سيكون من الأفضل العثور على وحدة المعالجة الخاصة بك أو اختراعها؟بالطبع ، نحن نبحث عن أنواع جديدة من المعالجات - وليس فقط الرسوم البيانية. الآن هناك تقنيات وأفضل - ستظهر في السوق في العامين المقبلين. يجب على المرء أن يكون مستعدا لذلك. هذا هو السبب في أننا على اتصال مع الشركات الناشئة والشركات المصنعة لرقائق الحوسبة ، بما في ذلك أجهزة الكمبيوتر الكمومية.
بمجرد تطور هذه التقنيات ، سيكون العالم قادرًا على حل المشكلات بشكل أسرع ، وهذا بالطبع لا يمكن أن ينتظر حتى يرى. للتفاؤل الشديد ، في غضون خمس سنوات ستظهر أول هذه الآلات ، إصداراتها المبكرة جدًا المناسبة للبحث الأكاديمي. وحتى أقل من عشر سنوات ستمر قبل المحاولات الأولى لإدخال مثل هذه التكنولوجيا في المجالات العامة: الطب والسلامة. قبل ذلك ، ستعمل GPU بشكل جيد. من المثير للاهتمام أن نرى ما يصبح في النهاية أسرع.
الشركات الروسية والبيانات الضخمة

بين العروض ، تجول الشباب والجمال حول المساحة الأنيقة ، وساروا على السطح ، وتحادثوا وشربوا عصير الليمون العشبي. لم أحصل عليه بسبب أستيل الغبي (بفضل يورجان لشرح) ، لكنني لست مستاءً.
بعد ذلك ، دخل ليونيد تكاشينكو ، رئيس قسم البيانات الضخمة في MTS ، أليسا تشوماشينكو ، مؤسس GOSU Data Lab ، مؤسس Segmento Roma Nester و Yevgeny Isupov من بنك Tinkoff ، إلى المرحلة لمناقشة البيانات الضخمة.
لقد اقتربت أنا والجمهور تمامًا من تصريحات ليونيد. من غير المعتاد سماع مثل هذا المستوى من الصراحة من أعلى واحدة من أكبر الشركات في روسيا. حقيقة أنني سأقتبس منه هنا أكثر لا يعني أنه تحدث أكثر من أي شخص آخر (هذا ليس إعلان MTS. لدي عامل مختلف ، ليونيد ، بناءً على كلماته ، قد طرح هذا بالفعل. على الرغم من أنه حتى في هذه الحالة يتحدث عني يعرف أكثر مما اعتقدت).

بدأ على الفور بحقيقة أن البيانات الضخمة لا تعمل في الوقت الحالي ، وتتضخم الأسطورة. وفقا له ، إذا لم يتم حل المشكلة بالطرق التقليدية ، فلن يتغير شيء مع ظهور البيانات الضخمة.
على سبيل المثال ، تمتلك MTS نموذجًا ناجحًا للتنبؤ بالزبون. عندما تم تطبيق البيانات الضخمة عليها ، كان النمو لا يكاد يذكر. والعكس صحيح. لم تتمكن MTS من التنبؤ بالموعد الذي سيقرر فيه المشتركون التبديل إلى تعريفة أرخص (من أجل الاتصال مقدمًا وإثناء اثنين من المكافآت). عندما حاولنا حل المشكلة باستخدام البيانات الضخمة ، فإنها لم تنجح.
لا حاجة للبحث عن معجزة في تقنيات البيانات الضخمة
اعترض عليه إيفجيني إيزوبوف:
- عندما أضفنا بيانات جديدة أو رياضيات أكثر تخصصًا ، والتي تسمح لنا بالقيام بهندسة ميزات متقدمة ، لإنشاء ميزات كان من الصعب على الشخص أن يبتكرها ، رأينا زيادة كبيرة هناك.
وبهذا اتفق ليونيد:
- هنا أيضًا مثال حيث تلعب إضافة البيانات الجديدة دورًا مهمًا. إذا شاهدنا كيف يتصل المشتركون لدينا ، فإننا نعلم فقط أنهم يتصلون. من الجدير إضافة الحد الأدنى من التحليل الجغرافي ، ومحطة قاعدة حيث يقضي الهاتف معظم الليالي ، ومحطة أساسية حيث يوجد خمسة أيام في الأسبوع. كل شيء - نحن نعلم أين تعيش وتعمل.
إذا أضفنا نمذجة استنادًا إلى ملف تعريف المكالمة - وقمنا بذلك - فيمكننا استعادة منزلك بالكامل. نرى أن هناك ثلاثة مشتركين في MTS ، خط مباشر آخر ومكبر صوت آخر. ليس لدينا محللون جيوديون ، نحن نعرف فقط كيف يسمون شبكتنا.
في هذا النموذج ، هناك أكثر من ألف شيء مهم للغاية لن تقوم أنت بإنشائه. على سبيل المثال ، مثل هذه الميزة - كيف تتغير كثافة الاتصال بين الأشخاص من 3 إلى 4 يوم الجمعة ، ومن 4 إلى 5. وهكذا. نحن نأخذ جميع أزواج الأصدقاء أو الغرباء الذين يتصلون ببعضهم البعض كثيرًا ، ويفرضون آلاف الميزات وقادرون على تقطيعها إلى قسمين - الأزواج الذين يعيشون معًا والأزواج الذين لا يعيشون معًا.
قادت أليسا تشوماشينكو الفكرة في اتجاه عملي - في المقام الأول ، حسب قولها ، المهام مستمرة ، وليس التقنيات. إذا كان من المنطقي القيام بشيء بمساعدة البيانات الضخمة ، وهو أكثر ربحية وأكثر فعالية من الأساليب القديمة ، فسيتم استخدامها. العمل مع Big Data من أجل Big Data ليس ضروريًا ، ولكن لسبب ما يحاول الكثيرون.
البيانات الضخمة هي الضجيج بالضبط ، وسوف تظهر حيث لا تنتمي على الإطلاق.
عندما سألت إذا كان أي شخص قد سمع عن DeepMind ، مدت يدي بالفكر ، "يا رب ، بالطبع سمع الجميع ، إنهم ، لعنة ، أكثر شهرة من البابا." لكن حوالي خمسة أشخاص رفعوا أذرعهم.
ثم بدأت أليس تتحدث عن انتصار الذكاء الاصطناعي في Go وأضافت حقيقة أدهشتني شخصيًا. اتضح أنه بالنسبة للشبكة العصبية المدربة وجدت تطبيقًا عمليًا. يتم استخدامه لتبريد خوادم Google.
يتعرف الذكاء الاصطناعي على أي نوع من ملفات التبريد أين ومتى يلتوي ويتعلم ويشجع نفسه ويعاقب - وقد أدت هذه العملية بالفعل إلى خفض تكاليف الخادم بنسبة 40٪.أليس نفسها ، لأنها تعمل مع الألعاب ، وتحلم بنظام يعرف كل شيء عن تفضيلات الألعاب الخاصة بها. تذكرت المرة الأولى التي دخلت فيها League of Legends ، وأعطتها اللعبة 30 ثانية لاختيار واحد من بضع مائة من الأبطال.- إذا كانت اللعبة تعرف أنني ألعب دائمًا - فستسلط الضوء على الأبطال الذين يناسبوني بشكل أفضل ، ونصحتني بعدم لمس الباقي. إذا كانت اللعبة تعلم أنني أحب ، فسوف أتحول إلى مستخدم وأتحمل المال فيها.
بالحديث عن مستقبل البيانات الضخمة ، أعاد مونولوج رائع ليونيد:- MTS هو رجل في الخمسينات من عمره. المستقبل إما حياة بائسة ، أو بشكل عام على فاجانكوفو. الاتصالات الكلاسيكية هي النهاية. نحن على علم بذلك ، وكعمل نتطلع إلى هيئة جديدة ، حيث ننقل روحنا إلى عمل جديد. وفي هذه الهيئة انتهينا.يمكن أن تصبح البيانات الكبيرة واحدة. لدينا ثلاث استراتيجيات:- التراكم الكامل لجميع البيانات عن العميل بشكل عام ، حتى لو لم نفهم كيفية استخدامه. تقنيات التخزين رخيصة بما يكفي لتخزين كل شيء.- فتح البيانات العلماء الوصول إلى البيانات ومحاولة أعمى شيء.- بناء عمل جديد قائم على المعرفة حول الناس ، على أساس الاختراق في رؤوسهم ، وأرواحهم ورغباتهم. اجعل أكبر قدر ممكن من التخصيص. لمعرفة كل شيء عنك ، كما لو كنا نراقبك ونتنصت عليك دون القيام بذلك.وقد تم بالفعل بناء الميل الأخير من هذا العمل - للقبض على شخص على الإنترنت وإظهار إعلان له. يبقى بناء الأول ، والاختراق بعمق وعمق ومعرفة ما يريد هذا الشخص رؤيته. بحيث يشتري كل شخص ثاني.يعتقد ليونيد أن مستقبل البيانات يمكن أن يذهب بطريقتين. أو ستصبح البيانات ملكًا للناس ، وسيتمكنون من بيع معلومات عن أنفسهم ، وتحديد الشركة وما سيتم فتحه. أو ستصبح البيانات ملكية كاملة للدول.ستعرف كل شيء عنا. ولكن على الأقل ستكون الحياة أكثر أمانًا.
يوافق الجميع على أنه سيتم تنظيم البيانات بشكل كبير بطريقة أو بأخرى.- يدرك كل من واجه اللائحة العامة لحماية البيانات (GDPR) خلال الأشهر الستة الماضية أن الوصول إلى البيانات الخاصة سيتم تنظيمه بشكل كبير. من ناحية أخرى ، هناك الصين ، التي تفهم أنها ليست كذلك. من المرجح أن تتبع روسيا النسخة الصينية. على أي حال ، فإن الشركات الضخمة التي تخزن هذه البيانات (تنظر إلى ليونيد بمكر) سوف تجد صعوبة.تعتقد الرواية أن القلق يولد من الجهل وسوء الفهم:- نحن في حالة من الذعر التكنولوجي. يخشى الجميع أن يعرف شخص ما شيئًا عنهم ، ولا يحب الجميع ذلك. على سبيل المثال ، هناك 15 سببًا تقنيًا وتجاريًا لعدم نجاح Facebook في التنصت على الأشخاص. لكن الناس يؤمنون بها ، ويدركون الآن الخدمة بشكل مختلف.يجب أن تكون عملية جمع البيانات شفافة بحيث لا يشعر الناس بالخوف.
كما هو الحال في جميع القضايا العالمية ، تولد التناقضات في أشياء صغيرة. مكان رسم الخط الفاصل بين الخصوصية والراحة ، إلى من وفي أي الحالات لنشر المعلومات الشخصية على العامة.كما قال يوجين ، عندما يتم استخدام معلومات مثل "ماذا فعلت الليلة الماضية" ضدك للضحك أو حتى إيذائك ، فأنت بالطبع لا تريد فتحها. ولكن إذا كانت هذه المعلومات ، على سبيل المثال ، يمكن أن تحسن الصحة أو النوم ، فيمكن التخلي عنها.يعتقد رومان أن الأمر يستحق الخوف من الشركات الصغيرة:"ستسرب الشركات الكبيرة أغلى من بيع بياناتي." إنها تجهد الشركات الصغيرة التي تسعى جاهدة إلى تحقيق الدخل من البيانات بكل قوتها. نقوم بشراء البيانات من 40 مصدرًا ، وبعضها من الشركات التي لم تقدم لنا أي بيانات عن الأشخاص. عندما يمكنك الإغلاق غدًا ، لا تتحمل مسؤولية كبيرة تجاه المجتمع والناس.أليس ، على العكس من ذلك ، تؤمن بمستقبل مشرق:- أريد فقط أن أعتقد أنه ليس لديك حساب مصرفي ، فقد أرسلوا لك بطاقة مرة واحدة. اليوم ، كل ما نقوم به أصبح علنا. لكنني لا أؤمن بالسيناريوهات المتطرفة ، لذلك أريد أن يظهر الذكاء الاصطناعي في وقت أقرب يعرض ويعرض علينا كل ما هو مناسب.ولخص ليونيد:- إذا كنت ترغب في بذل قصارى جهدك ، فمن الأفضل إيقاف تشغيل الهاتف.بدلا من الاستنتاجات
بالحديث عن الأخ الأكبر ، أتذكر دائمًا قصة واحدة. عندما كتب أورويل عام 1984 ، أرسل نسخة إلى مدرس مدرسته ، ألدوس هكسلي. و أجاب مع بريد إلكتروني - كتاب أشاد، ولكن هذه الفكرة لا نوافق على ذلك. وأعرب عن اعتقاده بأن "الترويج للطفولة والتنويم المغناطيسي للأدوية هو أكثر ملاءمة لكسب السلطة من السجون والهراوات".بطبيعة الحال ، فإن الخوف من حقيقة أن "Big Brother يراقبك" هو أمر أكثر إثارة ، والخوف منه أكثر متعة. ولكن ، عزيزي Sistema_VC ، أعتقد أن اسم Big Data ، Meet Brave New World سيكون أفضل.