يتفق العديد من المؤلفين الأجانب على أن عصر البيانات الكبيرة قد انتهى. وفي هذه الحالة ، يشير مصطلح البيانات الكبيرة إلى التقنيات المعتمدة على Hadoop. يمكن للعديد من المؤلفين تسمية التاريخ الذي غادرت فيه البيانات الكبيرة هذا العالم وهذا التاريخ هو 06/05/2019.
ماذا حدث في هذا اليوم المهم؟
في هذا اليوم ، وعدت شركة MAPR بتعليق عملها إذا لم تتمكن من العثور على الأموال اللازمة لمزيد من العمل. في وقت لاحق ، في أغسطس 2019 ، تم الحصول على MAPR بواسطة HP. لكن عند العودة إلى يونيو ، لا يمكن للمرء أن يفشل في ملاحظة مأساة هذه الفترة بالنسبة لسوق البيانات الكبيرة. هذا الشهر ، انهارت أسعار الأسهم مع CLOUDERA ، اللاعب الرائد في السوق المعينة ، والتي اندمجت مع HORTOWORKS غير المربحة بشكل مزمن في يناير من نفس العام. كان الانهيار كبيراً للغاية وبلغ 43٪ ، في النهاية ، انخفضت القيمة السوقية لكلوديرا من 4.1 إلى 1.4 مليار دولار.
من المستحيل عدم القول إن الشائعات حول تضخيم الفقاعة في مجال التقنيات القائمة على Hadoop قد بدأت منذ ديسمبر 2014 ، لكنها استمرت بشجاعة لمدة خمس سنوات أخرى تقريبًا. تستند هذه الشائعات إلى فشل Google ، الشركة التي ولدت فيها تقنية Hadoop ، من اختراعها. ولكن التكنولوجيا قد ترسخت خلال انتقال الشركات إلى أدوات المعالجة المستندة إلى مجموعة النظراء والتطور السريع للذكاء الاصطناعي. لذلك ، بالعودة إلى الوراء ، يمكننا أن نقول بثقة أن الزوال كان متوقعًا.
وهكذا ، انتهى عصر البيانات الضخمة ، لكن في عملية العمل على البيانات الضخمة ، أدركت الشركات جميع الفروق الدقيقة في العمل عليها ، والفوائد التي يمكن أن تقدمها البيانات الكبيرة للشركة ، وتعلمت أيضًا كيفية استخدام الذكاء الاصطناعي لاستخراج القيمة من البيانات الخام.
والأكثر إثارة للاهتمام هو مسألة ما الذي سيحل محل هذه التكنولوجيا وكيف ستستمر تقنيات التحليل في التطور.
التحليلات المعززة
خلال الأحداث الموضحة ، لم تجلس الشركات العاملة في مجال تحليل البيانات. ما يمكن الحكم عليه من المعلومات المتعلقة بالمعاملات التي حدثت في عام 2019. هذا العام ، تم تنفيذ أكبر صفقة في السوق - شراء Salesforce من منصة التحليلية Tableau مقابل 15.7 مليار دولار. وقعت صفقة أصغر بين Google و Looker. وبالطبع ، لا يمكن للمرء أن يفشل في ملاحظة الاستحواذ بواسطة Qlik - التاريخ الكبير لمنصة Attunity.
يدعي قادة سوق BI وخبراء Gartner حدوث تحول هائل في أساليب تحليل البيانات ، فإن هذا التحول سيدمر سوق BI بالكامل ويؤدي إلى استبدال BI بـ AI. في هذا السياق ، تجدر الإشارة إلى أن الاختصار AI ليس "ذكاءً اصطناعياً" بل "ذكاء معزز". دعونا نلقي نظرة فاحصة على ما هو مخفي وراء الكلمات "التحليلات المعززة".
تستند التحليلات المعززة ، بالإضافة إلى الواقع المعزز ، إلى عدة افتراضات عامة:
- القدرة على التواصل باستخدام البرمجة اللغوية العصبية (معالجة اللغة الطبيعية) ، أي في اللغة البشرية ؛
- استخدام الذكاء الاصطناعي ، وهذا يعني أن البيانات ستتم معالجتها مسبقًا بواسطة الذكاء الآلي ؛
- وبالطبع التوصيات المتاحة لمستخدم النظام ، والتي ولدت فقط نفس الذكاء الاصطناعي.
وفقًا لمصنعي الأنظمة التحليلية ، سيكون استخدامها متاحًا للمستخدمين الذين ليس لديهم مهارات خاصة ، مثل معرفة لغة SQL أو لغة برمجة نصية مماثلة ، والذين ليس لديهم تدريب إحصائي أو رياضي ، والذين ليس لديهم معرفة في مجال اللغات الشائعة والمتخصصة في معالجة البيانات والمكتبات المقابلة. يجب أن يكون لهؤلاء الأشخاص ، المسمى عالم بيانات المواطن ، مؤهلات أعمال متميزة فقط. مهمتهم هي الحصول على رؤى تجارية من النصائح والتنبؤات التي سيمنحها الذكاء الاصطناعي ، وسيكونون قادرين على تحسين تخميناتهم باستخدام البرمجة اللغوية العصبية.
وصف عملية المستخدمين الذين يعملون مع أنظمة هذه الفئة ، يمكن للمرء أن يتخيل الصورة التالية. يرى شخص قادم إلى العمل وإطلاق التطبيق المطابق ، بالإضافة إلى المجموعة المعتادة من التقارير ولوحات المعلومات التي يمكن تحليلها باستخدام الأساليب القياسية (الفرز ، والتجميع ، وتنفيذ العمليات الحسابية) ، تلميحات وتوصيات معينة ، مثل: "من أجل تحقيق KPI من حيث الكمية المبيعات ، يجب عليك تطبيق خصم على المنتجات من فئة "البستنة". بالإضافة إلى ذلك ، يمكن لأي شخص الاتصال بمراسل الشركة: Skype و Slack وما إلى ذلك. يمكنه طرح أسئلة الروبوت ، في نص أو صوت: "أحضر لي العملاء الخمسة الأكثر ربحية". بعد تلقي الإجابة المناسبة ، يجب عليه اتخاذ أفضل القرارات بناءً على خبرته في مجال الأعمال وجني الأرباح للشركة.
إذا تراجعت إلى الوراء ونظرت إلى تكوين المعلومات التي تم تحليلها ، وفي هذه المرحلة ، يمكن أن تبسط منتجات فئة التحليلات المعززة حياة الناس. من الناحية المثالية ، من المفترض أن يحتاج المستخدم فقط إلى الإشارة إلى المنتج التحليلي لمصادر المعلومات المطلوبة ، وسوف يتولى البرنامج نفسه إنشاء نموذج بيانات ومجموعة من الجداول ومهام مماثلة.
كل هذا يجب أن يضمن ، أولاً وقبل كل شيء ، "دمقرطة" البيانات ، أي يمكن لأي شخص تحليل مجموعة كاملة من المعلومات المتاحة للشركة. يجب دعم عملية صنع القرار بطرق التحليل الإحصائي. يجب أن يكون وقت وصول البيانات إلى الحد الأدنى ، لأنه ليس مطلوبًا لكتابة البرامج النصية واستعلامات SQL. وبالطبع ، سيكون من الممكن التوفير على متخصصي علوم البيانات ذوي الأجور العالية.
من الناحية الافتراضية ، تفتح التقنيات آفاقًا مشرقة جدًا للأعمال.
ما يحل محل البيانات الكبيرة
ولكن ، في الواقع ، لقد بدأت مقالتي مع Big Data. ولم أتمكن من تطوير هذا الموضوع دون القيام برحلة قصيرة إلى أدوات استقصاء المعلومات الحديثة ، والتي يكون أساسها غالبًا البيانات الكبيرة. من الواضح الآن أن مصير البيانات الضخمة استنتاج محسوم ، وهذه تقنيات سحابة. لقد ركزت على المعاملات التي تمت مع بائعي استقصاء المعلومات من أجل إثبات أن كل نظام تحليل لديه الآن تخزين سحابة تحته ، والخدمات السحابية لديها استقصاء معلومات أولي.
لا تنسى مثل هذه الركائز في مجال قواعد البيانات مثل ORACLE و Microsoft ، فمن الضروري أن نلاحظ اتجاههم المختار لتطوير الأعمال وهذه السحابة. يمكن العثور على جميع الخدمات المقدمة في السحابة ، ولكن لم يعد من الممكن الحصول على بعض الخدمات السحابية في المنزل. لقد قاموا بعمل كبير في استخدام نماذج التعلم الآلي ، وأنشأوا مكتبات متاحة للمستخدمين ، وقاموا بتكوين واجهات لتوفير الراحة للعمل مع الطرز من تحديدها إلى تحديد وقت البدء.
ميزة أخرى مهمة لاستخدام الخدمات السحابية ، والتي يتم التعبير عنها من قبل الشركات المصنعة ، هي وجود مجموعات بيانات غير محدودة تقريبًا حول أي موضوع لنماذج التدريب.
ومع ذلك ، فإن السؤال الذي يطرح نفسه ، ما هو حجم التكنولوجيا السحابية تترسخ في بلدنا؟