تحت القص هي قصة كيف ظهرت منطقة التعلم الآلي في دودو. المفسد: لقد أطلقت عليه. التفاصيل الفنية المتشددين لن تكون هنا ، تأكد من تخصيص مقالة منفصلة لهم. اليوم هو أكثر حول الدافع والدعم من الزملاء.

التحضير
صادفت موضوع التعلم الآلي ثلاث مرات ، حتى خرج منه شيء مفيد.
المدرسة الروسية
في المرة الأولى التي صادفت فيها التعلم الآلي في HSE - حصلت على برج آخر في اتجاه Big Data Systems عندما حصلت على وظيفة في Dodo. بعد أن مررت بموضوع الضجيج الهائل هذا على أحد الظلمات ، لم أفهم لماذا قضيت ثلاث سنوات من حياتي على الإطلاق. وحتى أكثر من ذلك ، لم أفكر في كيف يمكن أن يكون ذلك مفيدًا في الشركة. لم أكن مستعدًا لهذا التحدي المتمثل في القدر.
رحلة التشيكية
في المرة الثانية التي صادفت فيها هذا الموضوع في براغ ، في hackathon ، تعلموا الآلة المغلقة في Microsoft. جنبا إلى جنب مع شباب من شركات أخرى ، عملنا على مهمة التنبؤ بالطلب في Dodo خلال أيام العطلات وأيام الذروة. عدت بنموذج جاهز يتنبأ بالطلب. بعد هذا الاختراق ظهرت الأفكار التي سأتمكن من تطبيق المعرفة المكتسبة في الشركة. كان هناك.
حسنًا ، هل لديك نموذج في Jupyter ، إذن ماذا؟ كيفية استخدامها؟ واجهت كل المحاولات لشرح هذا الأمر لقطاع الأعمال واقعا قاسيا: ولذا فمن الواضح أنه سيكون هناك العديد من الطلبات في أيام العطلات وأيام الذروة. يمكن للبيتزا البالغة أن تتنبأ بالمبيعات بناءً على بيانات العام الماضي ، بينما واجهت البيتزا الجديدة مشاكل بدونها. لقد أجلنا محاولات تطوير التعلم الآلي. لكن الفكرة القائلة بأن بإمكاننا القيام بالمزيد مع البيانات عالقة بشدة في ذهني ولا ترغب في الخروج منها. الآن كنت مستعدًا للتحدي ، لكن الشركة لم تكن كذلك.
الحلم الأمريكي
أصبح الاجتماع الثالث مصيري. حصل فريقنا على مهمة صعبة ولكنها مهمة: تطوير وحدة بيتزا مخصصة للولايات المتحدة الأمريكية. هذا هو عندما يمكنك طلب البيتزا مع أي مجموعة من المكونات ، إنشاء وصفة خاصة بك. يجب عمل كل شيء في المشروع: من التغييرات في بنية قاعدة البيانات إلى رمز العميل على الموقع. لقد أمسكنا بالمهمة وقمنا بتطوير منتج أعتبره نصرًا حقيقيًا. انتقل التقييم الرئيسي إلى الركود من Alena ، الرئيس التنفيذي لدينا في الولايات المتحدة.

لقد قمنا بالوحدة ، لكنني رأيت مشكلة في التوسع. ماذا لو لم تظهر الوظيفة في مطعم بيتزا واحد أو اثنين في الولايات المتحدة ، ولكن في شبكة كبيرة؟ كيفية إدارة مثل هذا المنتج ، خطة الأسهم؟ قررت أن هذه الحالة يمكن أن تثبت الحاجة إلى تطوير التعلم الآلي في دودو. شعرت أن هذه المرة كنت والشركة على استعداد لإطلاق اتجاه جديد.
واحد على واحد مع السيارات
في الخلفية ، بدأت بتحليل مبيعات البيتزا الأمريكية المخصصة. باستخدام خوارزميات التجميع ، كان من الممكن إظهار أن جميع الوصفات التي أنشأها المستخدمون تستند إلى ست مجموعات أساسية من المكونات بالإضافة إلى اثنين من العناصر العشوائية. حتى التقرير البسيط المبني على هذه الخوارزمية سيسمح بالمبيعات شبه اليدوية للتنبؤ ومخزون الخطة. نظرًا للافتقار إلى البيروقراطية والقدرة على إعادة البناء أثناء التنقل ، حصلنا على الضوء الأخضر للبدء في الانخراط في هذا الاتجاه.
لقد فهمنا المدير الفني وناقشنا أكثر من مرة أنني سأحتاج إلى مغادرة الفريق الحالي والبدء في تطوير اتجاه جديد ، لإظهار أننا في حاجة إليه. كنت بحاجة للغطس في مجال جديد بوتيرة سريعة. فهمت أنه إذا لم ينجح الأمر ، فهناك طريقتان. الأول هو العودة إلى التطوير في فريق دودو آخر. والثاني هو تحديث سيرتك الذاتية على سمو وابحث عن وظيفة جديدة. لم أكن أريد واحدة أو أخرى. كنت في هذه الحالة لمدة ثلاثة أشهر تقريبًا ، حتى وصلت إلى وحدة المبيعات الإضافية.
المشروع الأول
مفسد آخر: اتضح أنه لتشغيل ML لا تحتاج إلى تشغيل شيء معقد. من الواضح ، أليس كذلك؟ ولكن من الصعب للغاية أن نفهم في بداية الرحلة.
الوحدة النمطية ، التي تقترح إضافة منتج إضافي إلى الطلب ، لا يتم التحكم فيها مباشرة من قبل أي شخص. هذا يعني أنني أستطيع أن أفعل ما أريد معه. Cherry on the cake - فرصة لزيادة المبيعات بمساعدة عروض أكثر تخصيصًا. في السابق ، كانت الوحدة تعمل ببساطة: إذا تمت إضافة البيتزا إلى الطلب ، يتم عرض فئة المشروبات في مبيعات إضافية ، إذا البيتزا والشراب ، ثم الحلويات وما إلى ذلك.
أظهر عدم مبالاة عدد كبير من الناس مرة أخرى أنني أعمل في شركة حيث يمكن للجميع تقديم الدعم. قضيت ساعات في العمل على البيانات والعروض الإضافية مع زميل التسويق. لقد نجحنا في تجميع جميع المستخدمين وفقًا لتفضيلاتهم ولائهم ، وذلك لكل مجموعة لتقديم عروض ثابتة بناءً على أفضل المنتجات في المجموعة.
الأرقام والبراهين
لقد ثبّتت تسجيل منتجات إضافية وأطلقت عروضًا جديدة على عينة من مليوني مستخدم.
عينة من المستخدمين ليست سوى جزء صغير من المبيعات. كان من الضروري التحرك نحو عملاء جدد غير مصرح لهم. لقد جرفت ما يكفي من المقالات والأدبيات حول التصفية التعاونية وخوارزميات العرض المختلفة للمستخدمين. فكرة التوصيات المستندة إلى المنتجات الموجودة في السلة فازت. شكلت التوصيات المستندة إلى العناصر ومقياس جيب التمام للتقارب أساسًا لنموذج جديد ، وإن كان بسيطًا ، ولكنه بالفعل يعمل.
في ديسمبر ، أطلقنا وحدة التوصيات المستندة إلى العناصر. أظهرت الإحصائيات أن المشترين قد يهتمون بالفعل بمنتجات مختلفة تمامًا ، وليس فقط المشروبات. ربما كان بعد ذلك أن دودو يعتقد أن البيانات وتطوير التعلم الآلي من شأنه أن يسمح لهم بالمنافسة في الأسواق المثقلة بالأعباء في المستقبل.
بعض الإحصاءات.

أفضل 10 منتجات مبيعا على الموقع

أفضل 10 منتجات للهواتف المحمولة

نمو المبيعات الأسبوعي
مقطورة التقنية
فيما يلي بعض التفاصيل الفنية حول سبب استناد النموذج إلى مقياس جيب التماثل للتشابه. هذه معاينة للمقال ، الذي سيتم إصداره في غضون شهرين. إذا كنت لا تحب الرياضيات ، فلا تتردد في الانتقال إلى القسم الأخير.
يوضح الجدول الأولي أدناه عدد الطلبات مع البضائع المشتراة لكل مستخدم. يمكننا تحديد تشابه مشتريات المستخدم مع مستخدم آخر - ولهذا نحتاج إلى حساب المسافة بين متجهات المستخدم.

جدول مبيعات العملاء
تعتمد المسافة على المقياس المحدد. يشمل حساب الفضاء الإقليدي وزن وحجم المتجه:

حيث a و b هما متجهان عميلان مختلفان من الجدول. دعونا نرى كيف ستبدو هذه المسافة على مثال مجردة.
لنفترض أننا ننظر إلى تاريخ العملاء الثلاثة - أ ، ب ، و ج. دعونا بناء مصفوفة من مشترياتهم.

بعد حساب المسافات الإقليدية بين العملاء ، نحصل على القيم التالية:
د (أ ، ب) = 16.22 ؛
d (b، c) = 13.38؛
د (أ ، ج) = 13.64.
تشير هذه القيم إلى أن العملاء b و c هم الأقرب إلى بعضهم البعض. لكن إذا نظرت إلى البيانات المصدر ، فإن الصورة هي العكس. يفضل العملاء a و b طلب المزيد من منتجات Pepperoni وأحيانًا أخرى ، بينما يفضل العميل c البيتزا الأعلى. يمكننا أن نستنتج أن حجم المتجه له تأثير سلبي لحساب المسافات بين العملاء. يأخذ مقياس جيب التشابه في الاعتبار فقط الزاوية بين المتجهات ، متجاهلاً أهمية حجم المتجه:

حساب المسافة باستخدام هذه الصيغة ، نحصل على:
d (a، b) = 0.9183؛
d (b، c) = 0.5848؛
d (a، c) = 0.7947؛
نرى أن العملاء a و b أقرب إلى بعضهم البعض. إنهم يفضلون مجموعة واحدة من البضائع دون مراعاة الفرق في عدد الطلبات الموضوعة. يتفق هذا المنطق مع رأي الخبراء لدينا ويقترح أن تفضيلات العملاء a و b هي الأقرب إلى بعضها البعض.
هذا هو مقطورة ، التفاصيل في شهرين.
البحث عن الخاص بك
نحن الآن في مرحلة تشكيل فريق سيكون فيه متخصصون في تنظيم تخزين البيانات وتطوير نماذج التعلم الآلي ووضعها قيد الإنتاج. ولكن الأهم من ذلك ، أننا نفهم الآن بشكل أفضل سبب حاجتنا إلى كل هذا. نحن أحرار في فعل أشياء رائعة حقًا ، من تنظيم نظام لوجستي ذكي وتخطيط المخزون إلى أفكار رائعة لأتمتة مطاعم البيتزا باستخدام تقنيات Computer Vision.
ثق بنفسك ونقاط قوتك ، حتى لو كانت النتيجة غير مرئية في الأفق. أود أن أنهي المقال بفكر شخص آخر - اقتباس من ماكس ويبر من تقريره لطلاب جامعة ميونيخ: "لا يمكنك أن تفعل أي شيء بحزن وتوقع ، وأنت بحاجة إلى التصرف بشكل مختلف - أنت بحاجة إلى اللجوء إلى عملك وتلبية" مطلب اليوم "- كإنسان ، مهنيا جدا. وسيكون هذا الشرط بسيطًا وواضحًا إذا وجد الجميع شيطانه ويطيع هذا الشيطان ، وينسج خيط حياته ". البحث لك.