تجربة تثبيت Apache Airflow على نظام التشغيل Windows 10

الديباجة : بناءً على إرادة القدر من عالم العلوم الأكاديمية (الطب) ، دخلت عالم تكنولوجيا المعلومات ، حيث يتعين علي استخدام معرفتي حول منهجية بناء تجربة واستراتيجيات لتحليل البيانات التجريبية ، ومع ذلك ، استخدم كومة تقنية جديدة بالنسبة لي. في عملية إتقان هذه التقنيات ، واجهت عددًا من الصعوبات ، والتي تم التغلب عليها لحسن الحظ حتى الآن. ربما ستكون هذه المشاركة مفيدة لأولئك الذين بدأوا للتو العمل مع مشاريع Apache.

لذلك هذه النقطة . مستوحاة من مقال بقلم يوري إميليانوف حول قدرات Apache Airflow في مجال أتمتة الإجراءات التحليلية ، أردت أن أبدأ باستخدام مجموعة المكتبات المقترحة في عملي. أولئك الذين ليسوا على دراية بتطبيق Apache Airflow على الإطلاق ، قد يكونون مهتمين بمقال مراجعة قصير على موقع المكتبة الوطنية باسم ن. بومان.

نظرًا لأن التعليمات المعتادة لبدء تشغيل Airflow ، على ما يبدو ، لا تنطبق على بيئة Windows ، وسيكون من الضروري استخدام عامل ميناء لحل هذه المشكلة في حالتي ، فقد بدأت في البحث عن حلول أخرى. لحسن الحظ ، لم أكن الأول في هذا المسار ، لذلك تمكنت من العثور على فيديو تعليمي رائع حول تثبيت Apache Airflow في نظام التشغيل Windows 10 دون استخدام عامل ميناء. ولكن ، كما يحدث في كثير من الأحيان ، عند تنفيذ الخطوات الموصى بها ، تنشأ صعوبات ، وأعتقد ، ليس فقط بالنسبة لي. لذلك ، أود التحدث عن تجربتي في تثبيت Apache Airflow ، ربما سيوفر بعض الوقت لشخص ما.

دعنا نذهب إلى خطوات التعليمات (المفسد - الخطوة الخامسة ، كل شيء سار على ما يرام):

1. تثبيت نظام Windows الفرعي لنظام Linux للتثبيت اللاحق لتوزيعات Linux

هذا هو أقل المشاكل ، كما يقولون:

لوحة التحكم ← البرامج ← البرامج والمكونات ← تمكين عناصر Windows وتعطيلها ← نظام Windows الفرعي لنظام Linux

2. تثبيت توزيع Linux من اختيارك

لقد استخدمت تطبيق أوبونتو .

3. تركيب وتحديث نقطة

sudo apt-get install software-properties-common sudo apt-add-repository universe sudo apt-get update sudo apt-get install python-pip 

4. تثبيت أباتشي تدفق الهواء

 export SLUGIFY_USES_TEXT_UNIDECODE=yes pip install apache-airflow 

5. قاعدة بيانات التهيئة

وهذا هو المكان الذي بدأت فيه صعوباتي الصغيرة. يرشدك التعليمات إلى إدخال أمر airflow initdb والانتقال إلى الخطوة التالية. ومع ذلك ، أنا دائما حصلت على airflow: command not found استجابة. من المنطقي افتراض وجود صعوبات أثناء مرحلة تثبيت Apache Airflow وأنه ببساطة لا توجد ملفات ضرورية. بعد التأكد من أن كل شيء في مكانه ، قررت أن أحاول تحديد المسار الكامل لملف تدفق الهواء (يجب أن يكون هذا كما يلي: ////airflow initdb ). لكن المعجزة لم تحدث والجواب هو نفس airflow: command not found . حاولت استخدام المسار النسبي للملف ( ./.local/bin/airflow initdb ) ، مما أدى إلى ظهور خطأ جديد ModuleNotFoundError: No module named json' ، والتي يمكن التغلب عليها بتحديث مكتبة werkzeug (في حالتي ، إلى الإصدار 0.15.4) :

 pip install werkzeug==0.15.4 

قراءة المزيد عن werkzeug هنا .

بعد هذا التلاعب البسيط ، تم إكمال الأمر ./.local/bin/airflow initdb بنجاح.

6. بدء خادم تدفق الهواء

صعوبات الوصول إلى تدفق الهواء لم تنته بعد. يؤدي تشغيل الأمر ./.local/bin/airflow webserver -p 8080 إلى حدوث خطأ في No such file or directory . ربما ، سيحاول مستخدم Ubuntu ذي خبرة على الفور التغلب على هذه الصعوبات في الوصول إلى الملف من خلال تطبيق export PATH=$PATH:~/.local/bin/ command (أي ، إضافة دليل /.local إلى مسار البحث الحالي للملفات القابلة للتنفيذ المحددة بواسطة متغير PATH / bin /) ، ولكن هذا المنشور مخصص لأولئك الذين يعملون بشكل أساسي مع Windows وقد لا يجدون هذا الحل واضحًا.

بعد المعالجة الموضحة أعلاه ، تم تنفيذ الأمر ./.local/bin/airflow webserver -p 8080 بنجاح.

7. URL: مضيف محلي : 8080 /

إذا سارت الأمور على ما يرام في المراحل السابقة ، فأنت على استعداد لقهر القمم التحليلية.

آمل أن تكون تجربة تثبيت Apache Airflow على نظام التشغيل Windows 10 الموضح أعلاه مفيدة للمبتدئين وستسرع من دخولهم إلى عالم أدوات التحليلات الحديثة.

في المرة القادمة ، أرغب في متابعة الموضوع والتحدث عن تجربة استخدام Apache Airflow في مجال تحليل سلوك مستخدمي تطبيقات الأجهزة المحمولة.

Source: https://habr.com/ru/post/ar462161/


All Articles