كيفية العثور بسرعة على متخصصي الذكاء الاصطناعي وعلوم البيانات وعدم فقدانهم

بالتعاون مع آنا بيروفا


مقدمة


تقوم البشرية كل يوم بإنشاء واستخدام وتخزين كميات هائلة من البيانات. كل مقالة أو مدونة أو مشاركة في الانستقرام وكل شيء في الواقع وكل حقيقة من وسائل الاتصال هي بيانات ، عند معالجتها ، تصبح ذات قيمة ، تحقق ربحًا وتحذر من مخاطر من يملكها وتعرف كيفية استخراج المعلومات ذات الصلة.


مع الإمكانات المتزايدة لتحليل البيانات والوعي بفائدة الأرشيفات الحالية ، فإن الحاجة إلى خبراء في علوم البيانات والتعلم الآلي والذكاء الاصطناعي (AI) قادرة أيضًا على العمل مع البيانات وإنشاء نماذج مفيدة بناءً عليها ، بالإضافة إلى أنظمة بيانات المعالجة الذاتية وإجبارهم للعمل.


لماذا يحتاج أولئك الذين يجندون فرقًا في هذا المجال إلى التفكير في طرق تجنيد جديدة؟


كما كتب TechCrunch في عام 2015 ، وفقًا لماكينزي ، الذي ، على ما يبدو ، لم يكن بعيدًا عن الحقيقة ، سيطلب 490.000 متخصص في هذا المجال بحلول عام 2018.


إذا كنت تعتمد على بيانات LinkedIn - من أصل 236 مليون ملف شخصي ، فإن حوالي 11،400-19،400 هي ملفات تعريف علماء البيانات.


يبلغ متوسط ​​الاستثمار السنوي لشركة Amazon في AI Hiring بالفعل 227.8 مليون دولار ، بينما يبلغ استثمار Google المنافس الرئيسي في AI Hiring 130.1 مليون دولار . يتلقى المتخصصون في مجال الذكاء الاصطناعي للشركات الرائدة من 100000 دولار إلى 500000 دولار سنويًا. ويتضح ذلك من خلال دراسة استقصائية أجرتها صحيفة نيويورك تايمز ، والتي ، من حيث المبدأ ، يتم فحصها بشكل دوري إما من dice.com أو monster.com أو LinkedIn.


المنطقة جديدة وفي اتجاه. لا تلبي كمية ونوعية المتخصصين الشباب أعلى طلب لهم في العالم كله وفي روسيا أيضًا - هنا يختلف الوضع فقط في ترتيب الرواتب وحتى الآن في عدد الوظائف الشاغرة المفتوحة في مجال علوم البيانات والذكاء الاصطناعي.


وفقًا لتحليل hh.ru ، فإن عدد الوظائف الشاغرة المفتوحة في مجال التعلم الآلي ، التعلم العميق ، علوم البيانات: أكثر من 1000. عدد المتخصصين المدربين ذوي الخبرة اللازمة لا يزيد عن 300. المرشحين الذين لديهم على الأقل الحد الأدنى من الخبرة في هذا المجال من الذكاء الاصطناعي ، علم البيانات غير مناسب لـ هذه المواقف حوالي 3 آلاف. وهذا في حد ذاته مشكلة للبحث والتوظيف منذ:


  • من ناحية ، هناك بالفعل عدد قليل من المتخصصين القيمين ؛
  • من ناحية أخرى ، هناك العديد من المرشحين الذين بدأوا طريقهم للتو في المجال المعني ، والذين سيتعين عليهم الاستثمار في تدريبهم (في حالة التوظيف).

كل هذا يؤدي إلى سوق عمل شديد الحرارة ، وعند التوظيف في هذا المجال ، يجب مراعاة عدد من العوامل:


  • أعلى منافسة للمواهب (الرواتب والشروط) - هناك وظائف شاغرة أكثر من المرشحين ، لكن متطلبات المرشحين عالية ؛ إحصاءات تقريبية: 10-15 عروض عمل لمرشح واحد لديه أكثر من 3 سنوات من الخبرة في علوم البيانات والذكاء الاصطناعي ؛
  • تضطر الشركات إلى أن تكون أكثر مرونة من حيث الراتب ، والجدول الزمني ، والفرص الإضافية ، بشكل عام ، يتم منح الأفضلية لساعات مرنة ، بدوام جزئي ، والحاجة إلى الحرية لتكون مبدعة من أجل العثور على أفضل النهج والحلول ؛
  • المرشح مهتم بالمشاريع والمهام منذ ذلك الحين عالم البيانات - غالبًا ما يكون له نوع شخصية معين: عقلية تحليلية ، ودافع للتطور الفكري والمهني ، وشغف للبحث ، ومجموعة متنوعة من المهام ، والفضول ، وفي المكان هناك الفردية الفردية والدقة في التعرف على النتائج ؛
  • ومع ذلك ، تحتاج الشركة إلى فريق قوي ، قادر على تحقيق النتائج في الوقت المناسب ، حيث يوجد شخص للتعلم منه ومع من يمكنه إنشاء مشاريع بحثية ؛
  • هناك حاجة إلى الموارد والقدرات ، ومعدات جيدة ، GPU.

بسبب المنافسة العالية على المواهب في هذا المجال ، يبرز عدد من أسئلة الاختيار ، أهمها:


  • أين تجد متخصصي الذكاء الاصطناعي وعلوم البيانات؟
  • كيفية التعرف كيف تختار الأفضل أو الواعد (الذي سيخضع للتدريب بسرعة وبشكل مربح) من دائرة صغيرة من المرشحين؟ ماذا يجب أن تكون معايير الاختيار للباحثين عن توظيف؟
  • كيف لا تخسر؟ كيف يتم الاحتفاظ بمتخصصي الذكاء الاصطناعي وعلوم البيانات؟

1. أين تجد؟


بالإضافة إلى المصادر القياسية والمعروفة ، أود أن ألفت الانتباه إلى المتخصصين الأكثر إنتاجية من حيث تجربتي الشخصية في توظيف الذكاء الاصطناعي وعلوم البيانات.


  • سلاك ، افتح قناة علوم البيانات. هذا المورد ليس مخصصًا لشركات التوظيف وهو مخصص بشكل أساسي للتواصل بين المهندسين والمتخصصين في مجال علوم البيانات.
    ما عليك القيام به: انشر إعلانك على Slack في مجتمع Open Data Science. من الأفضل أن تطلب من زملائك أو متخصصي DS أو مهندسي البيانات القيام بذلك ، دون إخفاء مستوى الرواتب وفرص التطوير. التأكيد على ميزات المهام والمشاريع الجذابة والتقنيات التي يمكن استخدامها.


  • مسابقات Kaggle.
    ما عليك القيام به: اختر الأفضل - 50-100 في مسابقات Kaggle. عادة ما تحل أول 20 مشكلة للمتعة ، وتستمتع بالعمل في الشركات الكبيرة ولا تبحث عن وظائف. بعد أول 20 ، يمكنك تحديد المرشحين المحتملين ذوي الإمكانات العالية في DataScience و AI ، والاتصال بهم ، وتقديم اجتماع ومشروع. في حالة الرفض ، من الممكن طلب توصيات باستخدام برنامج الإحالة لشركتك (يمكنك طرح أسئلة بالتفصيل حول الصيد مع Kaggle في PM ، أو ، إذا كنت مهتمًا ، فسوف نعد مادة منفصلة).


  • مؤشر H. مؤشر هيرش ، بل هو طريقة لتقييم / البحث عن المرشحين ، وهو أفضل للاستخدام عند البحث عن AI ، ML / DL ، Computer Vision ، Data Science Experts . يجعل هذا المعيار من الممكن تقييم أي من العلماء والأساتذة الذين يتم اقتباسهم بشكل أفضل وأيهما أسوأ والعثور على أولئك المتخصصين في المجال المهني المطلوب ويمكن أن يصبحوا معلمًا للمتخصصين الشباب. ما عليك القيام به: ابحث عن متخصصي علوم البيانات والذكاء الاصطناعي باستخدام البيانات المفتوحة على فهرس هيرش. اهتم بالمواضيع التي تناسب احتياجاتك. مؤشر متوسط ​​للعلماء من مختلف المستويات:
    1. عالم شاب ، طالب دراسات عليا - 0-2 ؛
    2. مرشح العلوم - 3-6 ؛
    3. دكتوراه في العلوم - 7-10 ؛
    4. عضو مجلس الرسالة - 10-15 ؛
    5. عالم مشهور عالمياً ، رئيس مجلس أطروحة - 16 وما فوق.

موقع مفيد للبحث عن المرشحين حسب مؤشر الاقتباس: eLIBRARY.ru.
يحتوي هذا الموقع على منشورات العلماء الروس. تم نشر أكثر من 24 مليون مقال ، يتم تحديث قاعدة البيانات باستمرار.
واحدة من الثغرات الرئيسية هي التسجيل في الموقع ، ثم العثور على أستاذ مع عدد كبير من المنشورات مع مستوى عال من الاقتباس ، وإيجاد طريقة للاتصال به وطلب توصيات من المؤلفين المشاركين والطلاب. كخيار ، افتح المنشورات واتصل بالمؤلفين المشاركين من خلال الشبكات الاجتماعية التي يمكن الوصول إليها.
عند توظيف العلماء ، من المهم مراعاة أنهم قد يفتقرون إلى المهارات العملية وفهم الأعمال ، ولكن قد تكون مهنتهم العلمية مفيدة لتطوير المشاريع كثيفة العلوم ، بما في ذلك في مجال الذكاء الاصطناعي.


  • تنظيم مسابقة علوم البيانات الخاصة بك: hackathon ، مسابقة برمجة. يتم إجراء مثل هذه الأحداث بواسطة مجتمع AI ، و Open Data Science ، وما إلى ذلك. يمكنك محاولة تنظيمه بنفسك ، ولكن من المرجح أن تعاني الجودة.
    مثال على المنافسة الجيدة: مسابقة Sberbank .


  • ابدأ دورة تدريبية مجانية في ML / Deep Learning - التنسيق ليس مهمًا. الشيء الرئيسي هو اتخاذ قرار بشأن الموضوع والمهام ، ورصد أنسب المتخصصين وفقا لنتائج حل "الواجبات المنزلية". للحصول على قمع جيد ، قم بدعوة أكثر من 50 من أفضل الواعدين. نتيجة لذلك ، سيبقى حوالي 10-15 ، ولن توظف أكثر من 5 ، ولكن هذه الطريقة ستوفر الكثير من الوقت والجهد.
  • نظام التوصيات الداخلية. تعيين مكافأة إحالة لائقة للموظفين الداخليين. تحفيز توصياتهم.
  • طور شبكة AI الخاصة بك. لا يزال مجتمع الذكاء الاصطناعي وعلوم البيانات في روسيا والعالم صغيرًا جدًا ويتواصل بنشاط في المؤتمرات ، ومن السهل الحصول على توصيات من معلمين ومتحدثين ، غالبًا ما يكون من الممكن القيام بذلك مجانًا (OpenAITalks ، Skolkovo Robotics ، NIPS ، ICLR إلخ.)

2. كيفية اختيار متخصصين في علوم البيانات والذكاء الاصطناعي


ليس من السهل على الموارد البشرية فهم جميع المفاهيم دفعة واحدة ، لذا فإن أهم شيء هو فهم العناوين الرئيسية جيدًا من أجل توجيه نفسك بطريقة أو بأخرى. والتصرف وفقًا للتعليمات (الفصل "القائمة النهائية ، أو مبادئ اختيار الموظفين") - أي توازن بوضوح شديد تعقيد العمل واختبار الدافع المالي وغير المالي.


لذا ، بالنسبة للمبتدئين ، من المهم تحديد ما يُفهم الآن كعالم بيانات


يستخدم علماء البيانات البيانات الإحصائية والتعلم الآلي والأساليب التحليلية لحل مشاكل الأعمال الحرجة. وظيفتها الأساسية هي مساعدة المنظمات على تحويل أحجام بياناتها الكبيرة إلى نماذج قيمة وقابلة للتنفيذ.


يجب أن يكون لديهم معرفة جيدة بالرياضيات ، برنامج ، تطوير خوارزميات التعلم الآلي لأتمتة الخوارزميات. ومن المتوقع أيضًا أن يكون لديهم قدرة عالية على تفسير البيانات ، والقدرة على تصورها مهمة ، ومهارات حل المشكلات مهمة ، حتى إذا لم يتم صياغة المشاكل حتى النهاية.


من المهم أن يتمكنوا من العمل مع أنواع مختلفة من البيانات وبيانات من مستويات مختلفة من الاستعداد.


إن الخلفية الرياضية الجيدة (معرفة الجبر الخطي ، والهندسة التحليلية ، ونظرية الاحتمالية والإحصاءات الرياضية) أمر لا بد منه. وهذا أكثر أهمية لتحليل البيانات من المعرفة الهندسية. تتطلب نماذج التدريب على ML فهمًا تمامًا للنماذج التي يجب استخدامها وكيفية تفسيرها وتحسين النتائج.


معرفة لغات البرمجة : Python أو R (ولكن التنقل في مكدس التكنولوجيا الذي تستخدمه) ؛ C / C ++ ؛ جافا
المهارات : سكالا ، أباتشي سبارك ، هادووب ، التعلم الآلي ، التعلم العميق ، والإحصاء.
بالإضافة إلى ذلك : Tensorflow ، PyTorch ، Keras ، Caffe ، Pandas إلخ ، Jupyter ، و RStudio. ، تجربة مع أنظمة عالية التحميل ، Cuda.


الفرق بين علماء البيانات ومهندس البيانات هو القدرة ليس فقط على تحليل البيانات ، ولكن أيضًا دمجها في الأنظمة الحالية. في هذا الصدد ، من المهم بشكل خاص معرفة عميقة بلغات البرمجة ، وكذلك تجربة إنشاء أو المشاركة في إنشاء أنظمة محملة للغاية ومتعددة الخيوط ، وما إلى ذلك.


المفاهيم الرئيسية التي يجب أن يكون المجند على دراية بها هي التعلم الآلي ، التعلم العميق ، علوم البيانات ، تعدين البيانات ، البيانات الكبيرة ، رؤية الكمبيوتر ، معالجة الصور ، التعرف على السيارة ، التعرف على الوجوه ، أنظمة التوصيات ، معالجة اللغة الطبيعية ، مسابقات kaggle.


تصفية المرشحين بناء على مقابلة هاتفية للموارد البشرية:


  1. من المهم أن نفهم مدى عمق معرفة المرشح في الرياضيات (الجبر الخطي ، نظرية الاحتمالات)
  2. ما الأطر التي تستخدمها؟ تجربة متنوعة مرحب بها.
  3. ما هي المشاريع الأكثر تعقيدًا التي كان على المشاريع إنشاؤها؟ ماذا كان الدور والنتيجة الشخصية؟
  4. ما المسابقات التي شارك فيها؟
  5. هل توجد مقالات في مجلات علمية وهنا على habr.com؟

خوارزمية التوظيف والاختيار:


  1. تتكون المقابلة الفنية من 3 أجزاء:
    • اختبار عبر الإنترنت لمدة 20 دقيقة. مثال على موقع لنشر اختبار عبر الإنترنت. ؛
    • اختبار - 1 ساعة. مقابلة فنية في المكتب. اختبار المهمة 20 دقيقة -1 ساعة. يمكنك إنشاء اختبار من 10 إلى 15 مهمة (المهام في نظرية الاحتمالات والإحصاءات الرياضية ورؤية الكمبيوتر والتعلم الآلي). يتم إجراء الاختبار من قبل المرشح وحده في غرفة الاجتماعات. ليس عليه حل جميع المشاكل ، ولكن من المهم حل 50٪ على الأقل. في الاختبار ، من المفيد تحديد نقاط لتقييم موضوعي والقدرة على مقارنة المرشحين ؛
    • الجزء الشفوي من المقابلة الفنية هو ساعة واحدة (مناقشة نتائج المشاكل في نظرية الاحتمالات والإحصاءات الرياضية وتحليل كيفية معالجة المرشح لحل المشكلات في رؤية الكمبيوتر والتعلم الآلي).

يجب أن يكون مفهوما أن ظروف العمل و "الأشياء الجيدة" الأخرى معروفة للمرشح ويتم التعبير عنها بصدق مقدمًا ؛ وإلا فلن يكون الدافع للجميع فقط .


  1. مقابلة الموارد البشرية والشخصية مع Timlider
    السمات الشخصية اللازمة لعالم البيانات هي:
    • قدرة عالية على التعلم: يجب أن يكون ذكيًا ، وأن يكتسب مهارات جديدة بسرعة ، وأن يكون مستعدًا ويتطور باستمرار في مجاله ويفضل أن يكون ذلك في مجال موضوع الشركة.
    • الفضول ، الاهتمام بالتقنيات الجديدة ، الخبرة العملية في استخدامها ، الاهتمام بالمجالات ذات الصلة.
    • المثابرة والمثابرة - القدرة على العمل على مشكلة واحدة لفترة طويلة
    • الإبداع - الاهتمام بالفرص الجديدة والتحفيز والقدرة على التوصل إلى حلول جديدة.

كيفية استبقاء متخصصي الذكاء الاصطناعي وعلوم البيانات في الشركة:


هنا ، أدوات الاحتفاظ القياسية لها خصائصها الخاصة.


  • القدرة على العمل مع خبير ، خبير في سوق الذكاء الاصطناعي في روسيا أو دول أخرى ، القدرة على كتابة الدكتوراه ، القيام بأبحاث مشتركة ؛
  • فريق من المهنيين الأقوياء ، الذين من الممكن التعلم منهم ومن المثير للاهتمام إنشاء مشاريع الذكاء الاصطناعي (أفضل 10 جامعات ، وموظفون من شركات واسعة النطاق من قادة سوق الذكاء الاصطناعي في روسيا) ؛
  • القدرة على كتابة مقال. لإجراء البحوث والمنشورات للمؤتمرات الدولية (NIPS ، ICLR الخ) ؛
  • المساعدة في الحصول على درجة علمية ، بما في ذلك الدولية ؛
  • الوصول إلى المصادر الأولية.

والقيم العالمية:


  • مهام مثيرة للاهتمام ، والقدرة على إصدار المنشورات ؛
  • الراتب المرتفع ونموه المنتظم وفقاً لمستوى السوق ؛
  • الاحترام بما في ذلك الثقة في الخبرة والاعتراف بالإنجازات في الشركة والمجتمع العلمي (المكافآت والمكافآت لتحقيق النتائج) ؛
  • معدات جيدة ، والوصول إلى البيانات ؛
  • معلومات عن التغييرات - يجب أن يكون الموظفون على دراية بالخطط المستقبلية للشركة. حتى في الشركات الكبيرة ، من المهم الانتباه إلى عدم إبقائها في الظلام ؛
  • رعاية الموظفين - استطلاعات رأي منتظمة مع إمكانية تلقي إجابات صادقة. كيفية تحسين حياة الموظفين ، ومساعدتهم على أن يكونوا أكثر كفاءة (الفواكه في المكتب ، والآلات الموسيقية ، وغرفة للاسترخاء ، والتهنئة ليس فقط في عيد ميلادك ، ولكن أيضًا في الأعياد الأخرى ، وما إلى ذلك).

في الختام ، تجدر الإشارة إلى أنه من المهم معرفة أن الفرق بين هذه الوظائف الشاغرة عن البقية - طرق التوظيف السابقة لهؤلاء المرشحين لا تعمل بشكل فعال. من المهم تحقيق التوازن بين النقص الشديد في المتخصصين ، والرغبة في أن يكونوا أكثر مرونة في الظروف والحاجة إلى تصفية واختيار المهنيين الأقوياء الذين يمكنهم تقديم مساهمة إيجابية في تغييرات الأعمال.

Source: https://habr.com/ru/post/ar412625/


All Articles