كيف تصبح عالم بيانات في عام 2019

Data Scientist هو خبير بيانات تحليلي يتمتع بالمهارات التقنية لحل المشكلات المعقدة ، وكذلك الفضول الذي يساعد على تعيين هذه المهام. هؤلاء الأخصائيون هم المسؤولون بشكل أساسي عن تحويل البيانات إلى الأفكار الناتجة باستخدام نماذج تنبؤية ذاتية التحليل والتحليل الخاص وفقًا لمتطلبات الشركة.

بمعنى آخر ، أن تكون عالمة بيانات مهمة مهمة للغاية في هذا القرن من البيانات. لدرجة أن المقال في مجلة هارفارد بيزنس ريفيو أطلق عليها (وهذا يشجع على أن تصبح واحدًا منهم!). "العمل الأكثر جاذبية في القرن الحادي والعشرين" (وهذا يطالبك أن تصبح واحدًا منهم!).

وأيضًا ، لن يكون مؤلمًا أن عمل "عالم البيانات" يؤتي ثماره جيدًا بمتوسط ​​راتب يبلغ 1022 ألف سنويًا. هذا هو السبب في أن هذه المقالة هي دليل كامل لتصبح عالم بيانات في عام 2019. هذه خريطة طريق يمكنك متابعتها إذا كنت تريد معرفة المزيد عن علوم البيانات.

ولكن لا يزال هناك الكثير من الالتباس بين الاختلافات في أدوار محلل البيانات وعالم البيانات ، لذلك سنبدأ مع هذه المقالة والانتقال إلى مواضيع أخرى ، مثل متطلبات التعليم ومتطلبات المهارات ، لتصبح متخصصًا في هذا المجال.

الفرق بين محلل البيانات وعالم البيانات


من الواضح أن كلا من Analyst و Data Scientist لديهما وصف وظيفي يتعلق بالبيانات. ولكن ما هي الاختلافات بينهما؟ هذا هو السؤال الذي لدى الكثير من الناس حول الاختلافات بين هذه التخصصات. لذلك دعونا توضيح هذا الشك هنا!

يستخدم Data Analyst البيانات لحل المشكلات المختلفة والحصول على بيانات مفيدة للشركة. يتم ذلك باستخدام أدوات مختلفة في مجموعات بيانات محددة بوضوح للإجابة على أسئلة الشركات ، مثل "لماذا تعتبر الحملة التسويقية أكثر فعالية في مناطق معينة" أو "لماذا انخفضت مبيعات المنتجات في الربع الحالي" وما إلى ذلك. للقيام بذلك ، تتمثل المهارات الرئيسية التي يمتلكها محلل البيانات في Mining Data و R و SQL والتحليل الإحصائي وتحليل البيانات ، إلخ. في الواقع ، يكتسب العديد من محللي البيانات مهارات إضافية ضرورية ويصبحون علماء بيانات.

من ناحية أخرى ، يمكن لـ Data Scientist تطوير عمليات وخوارزميات جديدة لنمذجة البيانات وإنشاء نماذج تنبؤية وإجراء تحليل لبيانات المستخدم وفقًا لمتطلبات الشركة. وبالتالي ، يتمثل الاختلاف الرئيسي في أنه يمكن لـ Data Scientist استخدام الترميز الثقيل لتصميم عمليات نمذجة البيانات ، وعدم استخدام العمليات الحالية للحصول على إجابات من البيانات ، مثل Data Analyst. للقيام بذلك ، تتمثل المهارات الرئيسية التي يمتلكها عالم البيانات في Mining Data و R و SQL و Learning Machine و Hadoop والتحليل الإحصائي وتحليل البيانات و OOPS وما إلى ذلك. وبالتالي ، فإن السبب وراء حصول علماء البيانات على رواتب أكثر من محللي البيانات. ، يكمن في مستويات مهارتهم العالية مقترنة بارتفاع الطلب وانخفاض العرض.

متطلبات التعليم لتصبح عالم بيانات


هناك العديد من الطرق لتحقيق هدفك ، ولكن ضع في اعتبارك أن معظم هذه المسارات تذهب إلى الكلية ، حيث إن درجة البكالوريوس لمدة أربع سنوات هي الحد الأدنى من المتطلبات.

الطريقة الأكثر مباشرة هي حصولك على درجة البكالوريوس في علوم البيانات ، حيث إنها ستعلمك بلا شك المهارات اللازمة لجمع وتحليل وتفسير كميات كبيرة من البيانات. سوف تتعلم كل شيء عن الإحصاءات وطرق التحليل ولغات البرمجة ، وما إلى ذلك ، والتي سوف تساعد فقط في عملك كعالم بيانات.

الحل الآخر الذي يمكنك اختياره هو الحصول على أي درجة تقنية تساعدك في دور عالم البيانات. بعضها علوم الحاسوب والإحصاء والرياضيات والاقتصاد. بعد الحصول على شهادة ، سيكون لديك مهارات الترميز ومعالجة البيانات وحل المشكلات الكمية. والتي يمكن استخدامها في علوم البيانات. بعد ذلك يمكنك العثور على وظيفة للمبتدئين أو الحصول على الماجستير والدكتوراه.

متطلبات المهارات لتصبح عالم بيانات


يتطلب عالم البيانات العديد من المهارات التي تغطي مناطق مختلفة. معظمهم مدرجون أدناه:

1. التحليل الإحصائي. كمتخصص في معالجة البيانات ، تتمثل مهمتك الرئيسية في جمع وتحليل وتفسير كميات كبيرة من البيانات وإنشاء أفكار مفيدة للشركة. من الواضح أن التحليل الإحصائي جزء كبير من التوصيف الوظيفي.
هذا يعني أنه يجب أن تكون على دراية بأساسيات التحليل الإحصائي على الأقل ، بما في ذلك الاختبارات الإحصائية ، التوزيعات ، الانحدار الخطي ، نظرية الاحتمالات ، أقصى تقديرات الاحتمالات ، وما إلى ذلك. هذا لا يكفي! من المهم أن يكون لديك فهم للطرق الإحصائية التي هي الطريقة المناسبة لمشكلة بيانات معينة ، بل والأهم من ذلك هو فهم الطرق التي ليست كذلك. بالإضافة إلى ذلك ، هناك العديد من الأدوات التحليلية المفيدة جدًا في التحليل الإحصائي لعالم البيانات. الأكثر شعبية منهم ساس ، Hadoop ، سبارك ، خلية ، خنزير . لذلك ، من المهم أن تعرفهم جيدًا.

2. مهارات البرمجة. مهارات البرمجة هي أداة أساسية في ترسانة الخاص بك. هذا لأنه من الأسهل بكثير دراسة وفهم البيانات من أجل استخلاص استنتاجات مفيدة إذا كان يمكنك استخدام خوارزميات معينة لتناسب احتياجاتك.

بشكل عام ، تعد Python و R أكثر اللغات استخدامًا لهذا الغرض. يستخدم بيثون بسبب قدرته على التحليل الإحصائي وسهولة قراءته. تحتوي Python أيضًا على حزم متعددة للتعلم الآلي ، وتصور البيانات ، وتحليل البيانات ، وما إلى ذلك (مثل Scikit-learn ) التي تجعلها مناسبة لعلوم البيانات. R يسهل أيضًا حل أي مشكلة تقريبًا في علوم البيانات باستخدام حزم مثل e1071 و rpart والعديد من المشاكل الأخرى.

3. تعلم الآلة. إذا كنت متصلاً بأي شكل من الأشكال بصناعة التكنولوجيا ، فمن المرجح أنك سمعت عن التعلم الآلي . يسمح هذا بشكل أساسي للآلات بتعلم المهام من التجربة دون الحاجة إلى برمجتها على وجه التحديد. يتم ذلك عن طريق آلات التدريب باستخدام نماذج التعلم الآلي المختلفة باستخدام البيانات والخوارزميات المختلفة.

وبالتالي ، يجب أن تكون على دراية بخوارزميات التعلم المتحكم وغير المنضبط في التعلم الآلي ، مثل الانحدار الخطي ، والانحدار اللوجستي ، وتجميع الوسائل K ، وشجرة القرار ، والأقرب من الجار ، وأكثر من ذلك. لحسن الحظ ، يمكن تنفيذ معظم خوارزميات التعلم الآلي باستخدام R أو Python Library (المذكورة أعلاه) ، لذلك لا تحتاج إلى أن تكون خبيرًا فيها. ما تحتاجه هو القدرة على فهم الخوارزمية المطلوبة بناءً على نوع البيانات التي لديك والمهمة التي تحاول تنفيذها تلقائيًا.

4. إدارة البيانات ومعالجة البيانات. تلعب البيانات دورًا كبيرًا في حياة عالم البيانات. لذلك ، يجب أن تكون متمرسًا في إدارة البيانات ، بما في ذلك استخراج البيانات وتحويلها وتحميلها. هذا يعني أنك تحتاج إلى استخراج البيانات من مصادر مختلفة ، ثم تحويلها إلى التنسيق المطلوب للتحليل ، وأخيراً تحميلها إلى مستودع البيانات. هناك منصات مختلفة لمعالجة هذه البيانات ، مثل Hadoop ، Spark .

الآن وبعد الانتهاء من عملية إدارة البيانات ، يجب أن تكون على دراية بمعالجة البيانات. معالجة البيانات - هذا يعني بشكل أساسي أنه يجب تنظيف البيانات الموجودة في وحدة التخزين وتوحيدها بطريقة متسقة قبل أن يتم تحليلها للحصول على أي بيانات صالحة.

5. الحدس من البيانات. لا نقلل من قوة البيانات الحدس. في الواقع ، هذه هي المهارة غير الفنية الرئيسية التي تميز عالم البيانات عن محلل البيانات. يتضمن حدس البيانات بشكل أساسي إيجاد أنماط في البيانات حيث لا تكون كذلك. إنه نفس الشيء تمامًا مثل العثور على إبرة في كومة قش ، وهي إمكانات حقيقية في كومة بيانات ضخمة غير مستكشفة.

حدس البيانات ليس مهارة يمكنك تعلمها بسهولة. بدلا من ذلك ، فإنه يأتي من الخبرة والممارسة المستمرة. وهذا بدوره يجعلك أكثر فاعلية وقيمة في دورها كعالم بيانات.

6. مهارات الاتصال. يجب أن يكون لديك مهارات اتصال جيدة لتصبح خبيرا في مجال عالم البيانات. هذا لأنه على الرغم من أنك تفهم البيانات بشكل أفضل من أي شخص آخر ، إلا أنك تحتاج إلى تحويل البيانات إلى تقييم كمي حتى يتمكن الفريق غير الفني من اتخاذ قرار.

هذا قد يشمل أيضا سرد القصص! لذلك ، يجب أن تكون قادرًا على تقديم بياناتك بتنسيق سردي مع نتائج ومعاني محددة حتى يتمكن الآخرون من فهم ما تقوله. ويرجع ذلك إلى حقيقة أن تحليل البيانات في النهاية يصبح أقل أهمية من الاستنتاجات العملية التي يمكن الحصول عليها من البيانات ، والتي بدورها ستؤدي إلى نمو الأعمال.

Source: https://habr.com/ru/post/ar477818/


All Articles