CampusInsight: من مراقبة البنية التحتية إلى تحليل تجربة المستخدم

يتم تضمين جودة الشبكة اللاسلكية بالفعل بشكل افتراضي في مفهوم مستوى الخدمة. وإذا كنت ترغب في تلبية الطلبات الكبيرة للعملاء ، فأنت لا تحتاج فقط إلى التعامل بسرعة مع مشاكل الشبكة التي نشأت ، ولكن أيضًا للتنبؤ بأكبر عدد منهم.

كيف نفعل ذلك؟ فقط من خلال تتبع ما هو مهم حقًا في هذا السياق هو تفاعل المستخدم مع الشبكة اللاسلكية.



تستمر أحمال الشبكة في النمو ، وهذا يؤثر بشكل خاص على القطاعات اللاسلكية - على الأقل بسبب انفتاح واجهتها. مع تزايد عدد الأجهزة ومعدلات نقل البيانات ، تتضاعف المشكلات مرة واحدة على عدة مستويات. على الطبيعة - تؤثر العديد من أجهزة إرسال الإشارة اللاسلكية على بعضها البعض ، حتى لو كانت تعمل في الأجزاء المجاورة من طيف الترددات. منطقياً ، يبدأ عدد كبير من الأجهزة المتصلة في التنافس على الحق في بدء الإرسال على التردد المحدد ، مما يزيد من التأخير في تسليم الحزمة لكل مستخدم.

في الوقت نفسه ، تتزايد توقعات كل عميل من استخدام الشبكة. إن تحميل صفحة مدتها 5 ثوانٍ في المتصفح ، والتي بدت قبل 20 عامًا مثل "قمة التكنولوجيا" ، لن يفاجئ أحدًا. امنح العملاء فيديو عالي الدقة دون أن يتلاشى.

يمكن للإصدارات الجديدة من معايير البث اللاسلكي ، والتي تستخدم طيف الترددات بشكل أكثر كفاءة ، أن تحل المشكلة جزئيًا. يهدف كل إصدار لاحق من Wi-Fi إلى نشر المزيد من الشبكات المحملة. ولكن في شبكة واسعة النطاق ، حيث يوجد أكثر من عشرة نقاط وصول ، لن يكون من الممكن إعطاء كل شيء للمعيار التالي (جميعًا ، تعمل الأجهزة في وضع التوافق مع الإصدارات السابقة بمجرد تلبية جهاز مستخدم قديم). نظرًا لعدم نجاحها في الاستمرار في التعايش مع أدوات المراقبة القديمة ، فإن بيئة الشبكة تزداد تعقيدًا باستمرار.

لماذا مراقبة طبيعية لم تعد تعمل


يعمل الطابع الكلاسيكي ، الذي لا يزال يلاحق مسؤولي جميع الشبكات ، بما في ذلك الشبكات اللاسلكية ، حصريًا عند الطلب. لقد نجح "المنبه" - نستيقظ ونفهم ما حدث من خطأ. في غضون ذلك ، لا يوجد "إنذار" ، يمكنك قصر نفسك على التحقق من الحمل على المكونات الرئيسية - الشبكة وأجهزة المستخدم.

وفقًا لهذه المهمة ، تعمل أدوات المراقبة والصيانة التقليدية على أساس قواعد صارمة ولا تظهر دائمًا على الفور المشكلات القائمة ، ناهيك عن نوع من التحليل التنبئي.

المشكلة الرئيسية هنا هي الفاصل الزمني لجمع البيانات. يتم جمع المعلومات حول حالة اتصالات الشبكة اللاسلكية مرة واحدة كل دقيقة ، وقد تحدث الحوادث بشكل جيد في الفترات الفاصلة بين مجموعة القراءات (مثال رائع هو رشقات الحمل النادرة التي "تعلق" الشبكة). عدم تلقي بيانات في الوقت الفعلي ، من الصعب للغاية فهم السبب الذي يجعل السبب الجذري للمشكلة. هل هذا سوء استخدام تغطية الشبكة؟ أو ربما التدخل الخارجي غير المرتبط بالأعمال بأي طريقة (على سبيل المثال ، الوحدة العسكرية القريبة "سكبت" على الهواء). لا توجد بيانات يمكن فيها رؤية التدهور التدريجي لبعض خصائص الشبكة ، وبالتالي فإن توطين المشكلة ليس بهذه البساطة. سيتعين على موظفي تقنية المعلومات قضاء ساعات إضافية في البحث عن مثل هذه "الإبرة في كومة قش".
لكن المستخدمين النهائيين يلاحظون المشكلة على الفور تقريبًا. خطأ في الاتصال ، إذاعة فيديو مقطوعة هي علامات ممتازة.

أدوات الرصد الكلاسيكية تقرير حزم الشبكة القادمة. لكنهم لا يستطيعون الإجابة على السؤال بأي طريقة ، ولكن ما إذا كان المستخدم قد حل مهمته.

للحصول على إجابة على هذا السؤال ، سيكون من الضروري تغيير ليس فقط الأداة ، ولكن أيضًا طريقة مراقبة المنظمة نفسها. من عمل "النار" على الطلبات (في الواقع ، مراقبة أداء وتحميل مكواة محددة) ، سنستمر في التحكم في تجربة المستخدم وتحديد المواقف التي يمكن أن تؤدي إلى حوادث.

يتضمن هذا التحول إدخال خوارزميات تحديد المشكلة أكثر تعقيدًا من التحذيرات البسيطة عند الوصول إلى قيم معينة. في النظام الأساسي لشبكة Huawei CampusInsight ، تستند هذه الخوارزميات إلى تجربة الخدمة اللاسلكية وتقنيات التعلم الذاتي.

تحت غطاء محرك السيارة CampusInsight


Huawei CampusInsight عبارة عن منصة قابلة للتطوير لمراقبة الشبكات اللاسلكية بمختلف الأحجام. بنيت على أساس بنية microservice. يتم نشر كل خدمة في عدة حالات ، يتم توزيع الرسائل بينها بواسطة الناقل المقابل. يمكن نشر مثيلات إضافية ديناميكيًا ، مما يزيد من سرعة نقل الأداة.

في الواقع ، يجمع CampusInsight البيانات ويحللها ويعرضها في واجهة المستخدم الخاصة به في خمس خطوات.



تتمثل الخطوة الأولى والثانية في الوصول إلى البيانات (إلى الأجهزة التي توفر جيلها) ومجموعة "القراءات". باستخدام التقاط Google عن بُعد لجهاز GPB و Syslog "التقليدي" (حيثما أمكن ذلك) ، يجمع Huawei CampusInsight البيانات في الوقت الفعلي تقريبًا:

  • على استخدام طيف الترددات ؛
  • تشغيل نقاط الوصول وأجهزة الشبكة الأخرى (مؤشرات الأداء ، عدد المستخدمين المتصلين ، إلخ) ؛
  • حول مسار مستخدمين محددين - حول ملفات تعريف الشبكة ، حول من ومتى وإلى أي نقطة وصول متصلة أو غير متصلة (ومع معلمات الاتصال) ؛
  • حول عمل تطبيقات الصوت والفيديو (باستخدام eMDI ، نفذت في واحدة من الحزم الإضافية).

للتحايل على قيود الأدوات التقليدية التي تستخدم SNMP لجمع البيانات وإرسال الهياكل الثابتة ، كان CampusInsight يعتمد على نموذج اشتراك للسجلات اللازمة وخوارزميات تشفير البيانات وفك تشفيرها.

والخطوة الثالثة هي التوزيع والتخزين المؤقت - أي إرسال البيانات الخام إلى كافكا لتوزيعها على خدمات التحليل على مستوى أعلى.

الخطوة الرابعة هي التحليل. تساعدك خوارزميات البيانات الكبيرة و الذكاء الاصطناعي على معالجة البيانات الأولية بسرعة. نتيجة لذلك ، يتم تحديد بعض المشكلات المرتبطة بـ:

  • المصادقة (بروتوكول Dot1x مدعوم) وعملية DHCP ؛
  • الاستقرار وسرعة الاتصال.
  • واجهات لاسلكية.
  • تشغيل الأجهزة الفردية ، بما في ذلك "التفاصيل" ، مثل مشاكل PoE أو تحويل جهاز ثنائي الموجات إلى 2.4 جيجا هرتز ؛
  • جودة تدفقات الصوت والفيديو - ومع ذلك ، يتم دعم الوظيفة فقط من أجل SIP غير المشفر أو لبعض المحولات ؛
  • التجوال بين نقاط الوصول المختلفة.

تُستخدم خوارزميات الذكاء الاصطناعي لحل بعض المشكلات المعينة ، على سبيل المثال ، لاكتشاف التداخل بين القنوات أثناء الإرسال اللاسلكي.



الخطوة الخامسة والأخيرة هي حفظ البيانات في قاعدة بيانات العمود الموزع Druid لاستخدامها لاحقا.

يتيح لنا تحليل المعلومات التي تم جمعها ، مع الأخذ في الاعتبار "الأساس" الذي تم إنشاؤه باستخدام نفس البيانات التاريخية ، تحديد "أنماط الفشل" النموذجية - تحديد مؤشرات الأداء الرئيسية المقابلة لحالات المشكلات وتحديد المواقع المحلية عن طريق اقتراح طرق لحلها. وبالتالي ، تندرج حوالي 85 ٪ من جميع مشاكل الشبكة في الاعتبار الأداة.



يتم تقديم البيانات إلى المسؤول في شكل رسوم بيانية وفقًا للتسلسل الهرمي أو طبولوجيا المساحة (على سبيل المثال ، تخطيط المكتب). يمكنك إنشاء "خرائط حرارة" ، وتحليل مدى تأثر معدات بعض المنصات أو الشركات المصنعة ، إلخ. من الأسهل فهم سبب المشكلة بالضبط.



بشكل عام ، يوفر CampusInsight عددًا قليلاً من الأدوات لتصنيف المشكلات ، ومقارنة المستخدمين المتأثرين ، وفحص البيانات المتعلقة بعميل معين ، وحتى أحداث "إعادة التشغيل" التي سبقت الحادث من أجل تحديد المصدر بسرعة. في الوقت نفسه ، يدعم المنتج أيضًا شبكة Wi-Fi 6 الجديدة ، ناهيك عن سابقاتها.

الحالات


تم اختبار CampusInsight بالفعل في الممارسة ، على الرغم من أن معظم الحالات مغلقة من قبل NDA. القضية المفتوحة الأكثر كشفًا هي استخدام أداة المراقبة في شبكة Huawei اللاسلكية.

تغطي الشبكة الشركات التي يعمل بها حوالي 180 ألف شخص ، منهم 80 ألفًا ينتمون إلى قسم البحث والتطوير (هذه مكاتب في أكثر من 170 دولة ، حيث تم تثبيت 62 ألف نقطة وصول).

ساعد تطبيق CampusInsight على تحسين أكثر من 630 نقطة وصول ، مع زيادة كفاءة تحليل الحوادث بنسبة 30 ٪.
فيما يلي بعض المواقف المحددة.

مثال 1. فشل المجموعة


غالبًا ما تكون المشكلات عالية المستوى التي يتم ملاحظتها على عدد كبير من المستخدمين ناتجة عن أخطاء منخفضة المستوى. ولتحديد مثل هذه المشاكل ليست بهذه البساطة. على سبيل المثال ، في أحد المكاتب ، واجه العديد من عملاء الأجهزة المحمولة على الفور صعوبات في المصادقة ، على الرغم من الإعدادات الصحيحة وغياب المشاكل مع خادم المصادقة. ساعد التصور للبيانات على مختلف المستويات في التعرف بسرعة على أن رمز التبديل هو مصدر المشكلة وتسبب في حدوث الكثير من الأخطاء. ولتصحيح الموقف ، كان من الضروري فقط استبدال قطعة من الكابل. استغرق توطين وتصحيح المشكلة 90 دقيقة.

مثال 2. تتبع جودة التجوال


يتيح لك جمع البيانات على طول مسار عميل معين داخل شبكة موزعة تحديد مشاكل التجوال غير الواضحة. والحالة الشائعة هي عندما يواجه المستخدمون المتنقلون في مناطق معينة من المبنى مشكلات في الاتصال بالشبكة (على الرغم من أن نقطة الوصول المقابلة في حالة جيدة). قد يكون أحد مصادر مثل هذه المشكلات هو الطاقة العالية جدًا لنقطة الوصول في الغرفة المجاورة - لذلك بدلاً من الاتصال بأقرب نقطة ، يحاول العميل الاتصال بالمنشأة التي تخدم حاليًا عددًا كبيرًا من المستخدمين (الحالة الحقيقية: الاتصال بنقطة وصول في مؤتمر في القاعة عندما يمر المستخدم ببساطة).

لحل المشكلة ، يكفي في بعض الأحيان تقليل قوة الإشارة للنقطة التي تم تحميلها ، ومع ذلك ، يتطلب التحديد إجراء تحليل عميق للمشاكل المتكررة في الغرف المجاورة لغرفة الاجتماعات.

تتبع اتجاهات تطوير الشبكات اللاسلكية ، يمكننا أن نتوقع في المستقبل المنظور ، أن العمالقة ، الذين تضم شبكاتهم الآلاف من نقاط الوصول ، ولكن أيضًا الأعمال متوسطة الحجم ، والتي قد تقتصر على العمل في الحوادث ، ستواجه مشكلات في الخدمة. على افتراض حدوث مثل هذا التطور في الأحداث ، فمن المنطقي أن ننظر عن كثب إلى معايير جديدة وأكثر كفاءة ومعدات عالية الأداء. ولكن تجدر الإشارة إلى التحول الضروري في نموذج الشبكة ، في حين أن العملاء لم يبدأوا بعد الترحيل الجماعي للمنافسين بسبب جودة الخدمة.

بطبيعة الحال ، سيكون منتج CampusInsight في الموقع مفيدًا للغاية في عمليات النشر الواسعة النطاق ، ولكن الآن يتوفر اشتراك في السحابة أيضًا للخدمة من Public Cloud Cloud المحلية ، المصممة للتطبيقات في قطاع SMB. بشكل عام ، يمكن لأولئك الذين يرغبون في تجربة كل شيء و "تطور" في الوقت الحالي.

Source: https://habr.com/ru/post/ar451618/


All Articles