كيفية السيطرة على البنية التحتية للشبكة الخاصة بك. الفصل الأول احتباس

هذه المقالة هي الأولى في سلسلة من المقالات بعنوان "كيفية اتخاذ البنية التحتية للشبكة تحت سيطرتك". يمكن العثور على محتويات جميع المقالات في السلسلة والروابط هنا .

أعترف تمامًا أن هناك عددًا كافيًا من الشركات التي لا تكون فيها شبكة بسيطة من ساعة واحدة أو حتى يوم واحد مهمة. لسوء الحظ أو لحسن الحظ ، لم تتح لي الفرصة للعمل في مثل هذه الأماكن. لكن ، بالطبع ، الشبكات مختلفة ، والمتطلبات مختلفة ، والمقاربات مختلفة ، ومع ذلك ، في شكل أو بآخر ، ستكون القائمة أدناه في كثير من الحالات "سارية".

لذلك ، فإن الظروف الأولية.

أنت في مكان عمل جديد أو لديك ترقية أو تقرر إلقاء نظرة جديدة على مسؤولياتك. شبكة الشركة هي مجال مسؤوليتك. بالنسبة لك ، هذا تحد إلى حد كبير وتحدي جديد ، وهو ما يبرر إلى حد ما نغمة التوجيه لهذه المقالة :). لكن ، آمل أن تكون المقالة مفيدة أيضًا لأي مهندس شبكة.

هدفك الاستراتيجي الأول هو تعلم مقاومة الانتروبيا والحفاظ على مستوى الخدمة المقدمة.

يمكن حل العديد من المهام الموضحة أدناه بوسائل متعددة. أنا عمدا لا تثير موضوع التنفيذ الفني ، كما من حيث المبدأ ، غالبًا ما يكون حل مشكلة معينة غير مهم ، ولكن كيفية استخدامها وما إذا كنت تستخدمها أمر مهم على الإطلاق. إنه ذو فائدة قليلة ، على سبيل المثال ، من نظام المراقبة المدمج لديك ، إذا كنت لا تبحث هناك ولا تستجيب للتنبيهات.

المعدات


تحتاج أولاً إلى فهم أين توجد أكبر المخاطر.

مرة أخرى ، يمكن أن يكون مختلفا. أعترف أنه في مكان ما ، على سبيل المثال ، ستكون هذه مشكلات أمنية ، وفي مكان ما مسائل متعلقة باستمرارية الخدمة ، وفي مكان ما ، ربما ، شيء آخر. لم لا؟

لنفترض بالتأكيد أن هذا هو استمرار الخدمة (كان هذا هو الحال في جميع الشركات التي عملت فيها).

ثم عليك أن تبدأ مع المعدات. فيما يلي قائمة بالموضوعات التي يجب البحث عنها:

  • تصنيف الأهمية للمعدات
  • وفرة المعدات الحرجة
  • الدعم والتراخيص

يجب أن تفكر في الأعطال المحتملة ، خاصة مع وجود المعدات في الجزء العلوي من تصنيف الأهمية. عادةً ما يتم إهمال احتمالية حدوث مشكلات مزدوجة ، وإلا فقد يصبح حلك ودعمك مكلفين بشكل غير معقول ، ولكن في حالة وجود عناصر شبكة مهمة للغاية ، يمكن أن يؤثر فشلها بشكل كبير على العمل ، يجب أن تفكر في ذلك.

مثال

لنفترض أننا نتحدث عن مفتاح الجذر في مركز البيانات.

نظرًا لأننا اتفقنا على أن استمرارية الخدمة هي المعيار الأكثر أهمية ، فمن المعقول توفير "التكرار" لهذا الجهاز. لكن هذا ليس كل شيء. يجب أيضًا أن تقرر مقدار الوقت ، في حالة حدوث عطل في المحول الأول ، يكون من المقبول بالنسبة لك أن تعيش مع مفتاح تبديل واحد فقط ، لأنه يوجد خطر من حدوث كسر له.

مهم! ليس لديك لحل هذه المشكلة بنفسك. يجب عليك وصف المخاطر والحلول الممكنة والقيمة لإدارة الشركة أو الشركة. يجب عليهم اتخاذ القرارات.

لذا ، إذا تقرر أنه نظرًا لاحتمال حدوث انهيار مزدوج ، فإن العمل لمدة 4 ساعات على مفتاح واحد هو ، من حيث المبدأ ، مقبول ، يمكنك فقط الحصول على الدعم المناسب (والذي سيتم استبدال الجهاز خلال 4 ساعات).

لكن هناك خطر من عدم تسليمها. لسوء الحظ ، بمجرد أن وجدنا أنفسنا في مثل هذا الموقف. بدلا من أربع ساعات ، ذهب الجهاز لمدة أسبوع!

لذلك ، يجب أيضًا مناقشة هذا الخطر ، وربما سيكون من الأصح بالنسبة لك شراء مفتاح آخر (ثالثًا) والاحتفاظ به في قطع الغيار (النسخ الاحتياطي البارد) أو استخدامه للأغراض المختبرية.

مهم! قم بإعداد جدول بجميع أشكال الدعم التي لديك مع تواريخ الانتهاء وإضافتها إلى التقويم بحيث تتلقى خطابًا بعد شهر على الأقل يجب أن تبدأ في القلق بشأن تمديد الدعم.

لن يتم تسامحك إذا نسيت تمديد الدعم وفي اليوم الذي يليه ، ستنهار أجهزتك.

أعمال الطوارئ


مهما حدث على شبكتك ، من الناحية المثالية ، يجب عليك الحفاظ على الوصول إلى معدات الشبكة الخاصة بك.

مهم! يجب أن يكون لديك وصول بوحدة التحكم إلى جميع المعدات ويجب ألا يعتمد هذا الوصول على قابلية تشغيل شبكة نقل بيانات المستخدم (البيانات).

يجب عليك أيضًا توقع السيناريوهات السلبية المحتملة وتوثيق الإجراءات اللازمة. يعد توفر هذا المستند أمرًا بالغ الأهمية ، وبالتالي لا ينبغي مشاركته فقط على مورد مشترك من قبل القسم ، ولكن أيضًا مخزن محليًا على أجهزة كمبيوتر للمهندسين.

يجب أن يكون هناك

  • المعلومات اللازمة لفتح تطبيق لدعم بائع أو تكامل
  • معلومات حول كيفية الوصول إلى أي جهاز (وحدة التحكم ، الإدارة)

بالطبع ، قد يتم احتواء أي معلومات مفيدة أخرى ، على سبيل المثال ، وصف لإجراء الترقية لمختلف المعدات وأوامر التشخيص المفيدة.

الشركاء


أنت الآن بحاجة إلى تقييم المخاطر المرتبطة بالشركاء. عادة ما يكون

  • مزودي خدمة الإنترنت ونقاط تبادل الحركة (IX)
  • مزودي قناة التواصل

ما هي الأسئلة التي تحتاجها لتسأل نفسك؟ كما في حالة المعدات ، من الضروري النظر في خيارات مختلفة لحالات الطوارئ. على سبيل المثال ، بالنسبة لموفري خدمات الإنترنت ، قد يكون الأمر مثل:

  • ماذا سيحدث إذا توقف ISP X عن توفير خدمة لك لسبب ما؟
  • هل لديك ما يكفي من النطاق الترددي لمقدمي الخدمات الآخرين؟
  • كيف حسن النية تبقى؟
  • ما مدى استقلال مزودي خدمة الإنترنت وهل سيؤدي حادث خطير في أحدهم إلى مشاكل مع الآخرين؟
  • كم عدد المدخلات البصرية إلى مركز البيانات الخاص بك؟
  • ماذا يحدث إذا تم تدمير أحد المدخلات بالكامل؟

بالنسبة للمدخلات ، في ممارستي في شركتين مختلفتين ، في مركزين مختلفين للبيانات ، دمرت حفارة الآبار وفقط بواسطة معجزة لم تتأثر بصرياتنا. هذه ليست حالة نادرة.

حسنًا ، بالطبع ، لا تحتاج فقط إلى طرح هذه الأسئلة ، ولكن ، مرة أخرى ، بدعم من القيادة ، لتوفير حل مقبول في أي موقف.

النسخ الاحتياطي


قد تكون الأولوية التالية هي نسخة احتياطية من تكوينات الأجهزة. في أي حال ، هذه نقطة مهمة للغاية. لن أدرج تلك الحالات حيث يمكنك أن تفقد التكوين ، فمن الأفضل عمل نسخة احتياطية منتظمة وعدم التفكير في الأمر. بالإضافة إلى ذلك ، يمكن أن يكون النسخ الاحتياطي المنتظم مفيدًا للغاية في التحكم في التغييرات.

مهم! عمل نسخة احتياطية يوميا. هذه ليست كمية كبيرة من البيانات لحفظ على هذا. في الصباح ، يجب أن يتلقى المهندس المناوب (أو أنت) تقريرًا من النظام يشير بوضوح إلى ما إذا كانت النسخة الاحتياطية ناجحة أم لا ، وفي حالة النسخ الاحتياطي غير الناجح ، يجب حل المشكلة أو إنشاء بطاقة (انظر عمليات قسم الشبكة).

إصدار البرنامج


مسألة ما إذا كنت ترغب في ترقية برامج الأجهزة أم لا ليست واضحة. من ناحية ، تُعرف الإصدارات القديمة بأخطاء وثغرات أمنية ، ولكن من ناحية أخرى ، لا يعد البرنامج الجديد دائمًا إجراء ترقية غير مؤلم ، وثانيًا ، الأخطاء والثغرات الجديدة.

هنا تحتاج إلى العثور على الخيار الأفضل. بعض التوصيات الواضحة

  • إصدارات مستقرة فقط
  • ومع ذلك ، يجب ألا تعيش على إصدارات البرامج القديمة جدًا
  • قم بوضع علامة بمعلومات أين يوجد أي برنامج
  • قراءة تقارير دورية عن الثغرات والأخطاء في إصدارات البرامج ، وفي حالة حدوث مشاكل حرجة ، يجدر التفكير في الترقية

في هذه المرحلة ، وبعد وصول وحدة التحكم إلى المعدات ومعلومات الدعم ووصف لإجراء الترقية ، فأنت مستعد من حيث المبدأ لهذه الخطوة. الخيار المثالي هو عندما يكون لديك معدات مختبرية حيث يمكنك التحقق من الإجراء بأكمله ، لكن لسوء الحظ ، لا يحدث هذا كثيرًا.

في حالة المعدات المهمة ، يمكنك الاتصال بدعم البائع مع طلب لمساعدتك في الترقية.

نظام التذاكر


الآن يمكنك أن تنظر من حولك. تحتاج إلى إنشاء عمليات التفاعل مع الإدارات الأخرى وداخل القسم.

ربما هذا ليس إلزاميًا (على سبيل المثال ، إذا كانت شركتك صغيرة) ، لكنني أوصي بشدة بتنظيم العمل بطريقة تمر بها جميع المهام الخارجية والداخلية عبر نظام التذاكر.

يعد نظام التذاكر بمثابة واجهة الاتصال الداخلي والخارجي بشكل أساسي ، ويجب عليك وصف هذه الواجهة بدرجة كافية من التفاصيل.

دعنا نأخذ مثالا على مهمة مهمة كثيرا ما تمت مواجهتها لفتح الوصول. سوف أصف خوارزمية نجحت في واحدة من الشركات.

مثال

بادئ ذي بدء ، غالبًا ما يعبر عملاء الوصول عن رغباتهم بلغة غير مفهومة لمهندس شبكة ، أي بلغة التطبيق ، على سبيل المثال ، "منحني حق الوصول إلى 1C".

لذلك ، نحن لم نقبل طلبات مباشرة من هؤلاء المستخدمين.
وكان هذا الشرط الأول

  • يجب أن تأتي طلبات الوصول من الأقسام الفنية (في حالتنا ، كانت هذه يونكس ونوافذ ومهندسون مكتب المساعدة)

الشرط الثاني هو ذلك

  • يجب تسجيل هذا الوصول (من قبل القسم الفني الذي تلقينا منه هذا الطلب) وكطلب ، نحصل على رابط لهذا الوصول المسجل

يجب أن يكون شكل هذا الطلب واضحًا بالنسبة لنا ، أي

  • يجب أن يحتوي الطلب على معلومات حول أيٍّ من الشبكات يجب أن يكون الوصول إليها مفتوحًا وأيضًا على البروتوكول و (في حالة tcp / udp)

كما ينبغي الإشارة إلى ذلك

  • وصف لماذا يتم فتح هذا الوصول
  • مؤقت أو دائم (إذا كان مؤقتًا ، حتى تاريخه)

ونقطة مهمة جدا هي

  • من رئيس القسم الذي بدأ الوصول (على سبيل المثال ، المحاسبة)
  • من رئيس القسم الفني ، ومن أين جاء هذا الطلب إلى قسم الشبكة (على سبيل المثال ، مكتب المساعدة)

في الوقت نفسه ، يُعتبر "مالك" هذا الوصول هو رئيس القسم الذي بدأ الوصول (مسك الدفاتر في مثالنا) ، وهو مسؤول عن الحفاظ على تحديث الصفحة بالوصول المسجل لهذه الإدارة.

تسجيل


هذا شيء يغرق فيه. ولكن إذا كنت تريد تنفيذ نهج استباقي ، فأنت بحاجة إلى معرفة كيفية التعامل مع دفق البيانات هذا.

فيما يلي بعض الاقتراحات العملية:

  • عرض السجلات التي تحتاجها يوميا
  • في حالة المشاهدة المجدولة (وليس في حالات الطوارئ) ، يمكنك قصر نفسك على مستويات الشدة 0 و 1 و 2 وإضافة أنماطك المفضلة من المستويات الأخرى إذا كنت تعتقد أن ذلك ضروري
  • اكتب نصًا يوزع السجلات ويتجاهل تلك السجلات التي قمت بإضافتها إلى قائمة التجاهل

سيسمح هذا النهج بمرور الوقت بتجميع قائمة سجلات التجاهل التي لا تهتم بها وترك فقط السجلات التي تعتبرها مهمة بالفعل.
انها عملت كبيرة بالنسبة لنا.

الرصد


ليس من غير المألوف أن لا يكون لدى الشركة نظام مراقبة. يمكنك ، على سبيل المثال ، الاعتماد على السجلات ، ولكن يمكن للمعدات ببساطة أن "تموت" دون الحاجة إلى "قول" أي شيء ، أو قد تفقد حزمة بروتوكول syslog udp ولا تصل. بشكل عام ، بطبيعة الحال ، الرصد النشط مهم وضروري.

المثالان الأكثر طلبًا في ممارستي:

  • مراقبة تحميل قنوات الاتصال ، والروابط الهامة (على سبيل المثال ، الاتصال بموفري). إنها تسمح لك برؤية المشكلة المحتملة لتدهور الخدمة بشكل استباقي بسبب فقدان حركة المرور ، وبالتالي تجنبها.
  • الرسوم البيانية المستندة إلى NetFlow. أنها تجعل من السهل العثور على الشذوذ حركة المرور ومفيدة للغاية للكشف عن بعض أنواع بسيطة ولكنها مهمة من هجمات القراصنة.

مهم! إعداد إشعار الرسائل القصيرة لأكثر الأحداث أهمية. وهذا ينطبق على كل من الرصد والتسجيل. إذا لم يكن لديك نقلة في الخدمة ، فيجب أن تأتي الرسائل القصيرة أيضًا بعد ساعات.

فكر في العملية بطريقة لا تستيقظ كل المهندسين. كان لدينا مهندس في هذا العمل.

تغيير السيطرة


في رأيي ، ليس من الضروري التحكم في جميع التغييرات. ولكن ، على أي حال ، يجب أن تكون قادرًا ، إذا لزم الأمر ، على العثور بسهولة على من ولماذا أجريت تلك التغييرات أو غيرها في الشبكة.

بعض النصائح:

  • استخدم نظام التذاكر للحصول على وصف تفصيلي لما تم القيام به كجزء من هذه البطاقة ، على سبيل المثال ، نسخ التكوين المطبق على البطاقة
  • استخدم إمكانات التعليق على أجهزة الشبكة (على سبيل المثال ، الالتزام بالتعليق على Juniper). يمكنك تسجيل رقم التذكرة
  • استخدام فرق النسخ الاحتياطي التكوين الخاص بك

يمكنك إدخال هذا كعملية من خلال البحث في جميع التذاكر يوميًا عن التغييرات.

العمليات


يجب إضفاء الطابع الرسمي على العمليات ووصفها في فريقك. إذا وصلت إلى هذه النقطة ، فيجب أن تعمل العمليات التالية على الأقل في فريقك:

العمليات اليومية:

  • العمل مع التذاكر
  • العمل مع سجلات
  • تغيير السيطرة
  • ورقة الشيكات اليومية

العمليات السنوية:

  • تمديد الضمانات والتراخيص

العمليات غير المتزامنة:

  • استجابة لحالات الطوارئ المختلفة

اختتام الجزء الاول


لقد لاحظت أن كل هذا لا يتعلق بتكوين الشبكة أو التصميم أو بروتوكولات الشبكة أو التوجيه أو الأمان ... هذا شيء موجود. لكن هذه ، على الرغم من أنها ربما تكون مملة ، ولكن ، بالطبع ، عناصر مهمة للغاية في وحدة الشبكة.

حتى الآن ، كما ترى ، لم تقم بتحسين أي شيء على شبكتك. إذا كانت هناك ثغرات أمنية ، فستبقى ؛ وإذا كان هناك تصميم رديء ، فسيظل كذلك. حتى تقوم بتطبيق مهاراتك ومعرفتك بمهندس شبكة ، والذي من المحتمل أن يكون قد قضى الكثير من الوقت والجهد وأحيانًا في بعض الأحيان المال. لكن عليك أولاً إنشاء (أو تقوية) الأساس ، ثم القيام بالبناء.

الأجزاء التالية تتعلق بكيفية البحث عن الأخطاء وإصلاحها ، ثم تحسين البنية الأساسية لديك.

بالطبع ، ليس من الضروري أن تفعل كل شيء بالتتابع. الوقت يمكن أن يكون حاسما. هل بالتوازي إذا سمحت الموارد.

وإضافة مهمة. التواصل ، اسأل ، التشاور مع فريقك. في النهاية ، الأمر متروك لهم لتقديم الدعم والقيام بكل هذا.

Source: https://habr.com/ru/post/ar433614/


All Articles