باحث في مختبر Sberbank AI - حول علوم البيانات ومهام RnD



الشبكات العصبية ليست مسلية فقط Prisma و FindFace. اليوم ، أصبح التعلم الآلي والبيانات الضخمة قادرًا على حل مشاكل العمل الحقيقية. ديمتري باباييف ، الرئيس السابق لقسم علوم البيانات في MTS ، مطور الخوارزمية لإكمال الاستعلامات في محرك بحث Yandex ، يعرف عن التقنيات الجديدة في قطاع B2B.

يعمل الآن كباحث في مختبر الذكاء الاصطناعي في سبيربنك. لسوء الحظ ، فإن معظم تطورات البنك سر تجاري ، لكن الأخصائي أخبر بلهفة عن كل ما هو مسموح به.

المقابل: داريا كوزلوفا
المدعى عليه: دميتري باباييف

ما هي الشركات الروسية التي لديها مختبرها الخاص بالذكاء الاصطناعي والبيانات الضخمة؟

في روسيا ، يوجد عدد قليل من الشركات لديها مختبرات مماثلة ، حيث أن هذا تاريخ أكاديمي إلى حد كبير. لدى ياندكس بالتأكيد وحدة بحث. وهي متوفرة أيضًا في الشركات الأجنبية - على سبيل المثال ، Google و Microsoft و Facebook. تحتوي الشركات الكبيرة وبعض الشركات متوسطة الحجم على أقسام لعلوم البيانات ، لكنها عادة لا تهتم كثيرًا بالبحث النظري.

ما المهام التي تعتقد أنها تحاول حلها؟

تتعامل أقسام علوم البيانات مع التحديات التي تحتاجها الشركات. قبل القيام بمهمة ، يقومون بتقييم الأثر الاقتصادي لتنفيذها ، على أساسهم يقررون ما إذا كانوا يفعلون شيئًا أم لا. لكن هذا أسهل في أقسام البحث - تعتبر الفوائد المحتملة لحل مشكلات البحث عالية جدًا.

هل ستعطي بعض الأمثلة؟

يمكن إظهار المهمة المعتادة لعلوم البيانات بمثال من مجال الاتصالات: للعثور على الأشخاص المهتمين بالتعرفة الجديدة. مثال آخر: الاستفادة المثلى من تشكيلة السلع في سلاسل البيع بالتجزئة. في كثير من الأحيان ، تمكنت الشركات من توفير كميات كبيرة جدًا عن طريق جلب التشكيلة المناسبة إلى المتاجر المناسبة ، على سبيل المثال ، إرسال سلع باهظة الثمن إلى المتجر حيث سيتم شراؤها ، وليس المتجر الذي ستجمع فيه الغبار على الرفوف.

قد تبدو مهام البحث مختلفة. مثال على هذه المهمة هو فهم لماذا تعطي الشبكة العصبية توقعًا واحدًا أو آخر - لبيانات إدخال أو أخرى. ولكن بشكل عام ، مهام RnD متنوعة للغاية.

ما المبالغ التي يتم استثمارها في التطورات المتعلقة بالذكاء الاصطناعي وتعلم الآلة؟

يعتمد على الشركة. في الشركات الكبيرة ، هم على استعداد لإنفاق المزيد من المال على هذا ، في الشركات الصغيرة - أقل. في مجال الاتصالات ، وفقا لملاحظاتي ، يحتاج مشروع كبير ، حيث تكون أحجام البيانات مئات تيرابايت ، من عشرات إلى مئات الملايين من روبل. من ناحية أخرى ، ليس هناك حد للكمال (الابتسامات - تقريبا. إد) .

في Yandex ، قمت بتطوير آلية للإكمال التلقائي لاستعلامات البحث. هل يمكن اعتبار ذلك تقنية الشبكة العصبية؟ كيف تعمل الخوارزمية؟

لا ، لقد كان منهجًا كلاسيكيًا للتعلم الآلي (ML) يعتمد على إحصائيات طلبات البحث. بناءً على البداية التي تم إدخالها للاستعلام واستعلامات المستخدم النموذجية ، تم تحديد الخيارات الأكثر ملاءمة للإضافة التلقائية من قاعدة بيانات استعلامات البحث الأكثر شيوعًا. كان هذا قبل الشبكات العصبية ، عندما اعتبرها الجميع تقنية طريق مسدود. ثم كانوا لا يزالون أدنى من خوارزميات ML الكلاسيكية.

حدثنا عن أهم الإنجازات الروسية في مجال الذكاء الاصطناعي.

المثال الأكثر شهرة هو بريزما. الشركة غير مسجلة في روسيا ، ولكن مع ذلك ، فإن العمود الفقري للدولة هو متخصصون محليون. بالمناسبة ، العلماء الذين طوروا طريقة معالجة الصور المستخدمة في Prism هم أيضًا من روسيا (مجموعة Victor Lempitsky).

في Yandex ، تقع خوارزميات الذكاء الاصطناعي في صميم نتائج البحث. تسمى خوارزمية الترتيب لقرب نص الاستعلام والموقع باستخدام الشبكة العصبية Palekh.

مثال آخر معروف هو FindFace من NTechLab. هذه هي عروض عملية تشغيل خوارزمية التعرف على الوجوه ، والتي تبيعها كمنتج تجاري.

الشركات الروسية التي تعمل في مجال تقنيات الصوت ، على سبيل المثال ، مركز تقنيات الكلام ، معروفة أيضًا في السوق العالمية.

في سبيربنك ، بالمناسبة ، تم استخدام تقنية القياسات الحيوية للوجه لإحدى الشركات الروسية لعدة سنوات. يتم استخدامه لمكافحة سرقة الهوية في الإقراض بالتجزئة. يوظف المختبر الأشخاص الذين شاركوا في هذا المشروع.

يتطلب الانتقال إلى التقنيات الجديدة استبدال الأجهزة والبرامج ، والتي يشعر المستخدم النهائي بنفسه في شكل أعطال وأخطاء في الشبكة. كيفية تنفيذ المرحلة الانتقالية بشكل غير واضح قدر الإمكان للعميل؟

في الواقع ، هذه مهمة كلاسيكية في التطوير ؛ فقد تمكنوا من حلها لفترة طويلة. طريقة واحدة هي الاختبار. قبل تقديم الإصدار الجديد ، يتم اختباره لفترة طويلة: يتحققون من حالات الحدود ، بالإضافة إلى ما إذا كان البرنامج يمكن أن يتحمل الحمل المطلوب ، ثم يفتح الإصدار الجديد لمجموعة صغيرة من المستخدمين. في هذه الحالة ، إذا حدث خطأ ما ، فستعاني أقل نسبة من المستخدمين.

هل الذكاء الاصطناعي قادر على إصلاح الأخطاء والأعطال في النظام بشكل مستقل؟

هناك خوارزميات مصممة فقط لمثل هذه المواقف. لكن مهمتهم ليست الكشف عن الفشل أو إصلاحه ، ولكن التنبؤ بأنه سيحدث قريبًا - لرؤية أنماط غير طبيعية في النظام. عادة في النظام المعقد ، هناك الكثير من المؤشرات لحالة ما هو عليه الآن. بعد اكتشاف نمط غير طبيعي ، يمكن للذكاء الاصطناعي أن يرسل رسالة إلى المسؤولين: شيء ما يسير على ما يرام - انظر ما - هناك شيء يجب القيام به. على سبيل المثال ، زاد الحمل ، فمن الضروري إضافة قدرات خاملة حتى يتحمله النظام.

اليوم ، تتمتع منظمة العفو الدولية بشخصية رصد ووظيفة كشف "مقدمًا" (على سبيل المثال ، ساعتان). ولكن لإصلاح المشكلة ، لا يزال هناك حاجة إلى شخص.

ما الذي يعملون عليه في مختبر AI Sberbank الآن؟

تم إنشاء مختبر Sberbank AI لتطوير كفاءة الذكاء الاصطناعي في المنظمة. الآن ، مع ظهور طرق التدريس الفعالة للشبكات العصبية العميقة ، حقق هذا المجال تقدمًا كبيرًا. تحتاج الشركات الكبيرة إلى أشخاص على دراية بتقنيات الذكاء الاصطناعي الجديدة لمواكبة التقدم السريع. من المهم أيضًا فهم المجالات التي يكون فيها الذكاء الاصطناعي منطقيًا لاستثمار الجهد والمال. سوف يساعد المختبر في معرفة ذلك.

مهمة أخرى مهمة للمختبر هي أبحاثه الخاصة في هذا المجال ، بالإضافة إلى إنشاء تقنيات جديدة تفيد البنك. بالطبع ، نحن منخرطون في الأبحاث التي يمكن تطبيقها في البنك ، ولكننا نحاول أيضًا التأكد من أن نتائجنا مفيدة ليس فقط في المجال المالي. على سبيل المثال ، نحن مهتمون باتجاه تحليل السلاسل الزمنية ؛ هناك الكثير من البيانات مع مثل هذا الهيكل (المعاملات وغيرها) في مجال الخدمات المصرفية. من الأعمال ذات المكون العلمي الأكبر ، يمكن للمرء أن يتذكر البحث حول إنشاء طرق جديدة لتفسير نتائج عمل الشبكة العصبية.

مع من يعمل سبيربنك؟

يتعاون البنك مع العديد من الجامعات: معهد موسكو للفيزياء والتكنولوجيا ، HSE ، جامعة موسكو الحكومية. الآن على سماع iPavlov ، مشروع مشترك مع MIPT. هذا مشروع لتطوير أنظمة الحوار للتواصل مع جهاز كمبيوتر بلغة طبيعية. هناك أيضًا أنشطة مثيرة للاهتمام للغاية مع جامعات أخرى ، من حل مشكلات التحسين المعقدة إلى التطورات الأساسية لتحسين خوارزميات التعلم العميق. لا يزال هناك العديد من الأنشطة للتعلم وتعزيز المعرفة - على سبيل المثال ، محاضرات الذكاء الاصطناعي للطلاب.

ما هي خصوصية خوارزميات Sberbank AI؟

هناك قسم مصرفي كلاسيكي. على سبيل المثال ، التقييم هو تقييم للجدارة الائتمانية للعميل. في جميع البلدان ، يتم تنظيمه من قبل البنوك المركزية ، وبالتالي فهو يعتمد إلى حد كبير على أساليب جيدة التفسير - الانحدار اللوجستي وأشجار القرار. هذه الأساليب الكلاسيكية موثوقة ومستقرة. في المستقبل ، نأمل أن تسمح الهيئة التنظيمية باستخدام طرق أكثر تعقيدًا. للقيام بذلك ، من الضروري إثبات أن الطرق الجديدة موثوقة بما فيه الكفاية.

في مختبر الذكاء الاصطناعي من Sberbank ، نتعامل مع طرق أكثر تعقيدًا ، وبشكل أساسي الشبكات العصبية العميقة وخوارزميات الذكاء الاصطناعي للبيانات النموذجية للبنوك. نوع البيانات النموذجي للبنوك هو سلسلة زمنية: على سبيل المثال ، سعر المنتج (السعر بالأمس ، اليوم السابق ، وما إلى ذلك).

في 19 أبريل ، ستتحدث كمتحدث في مؤتمر AI . ماذا تقول للزوار؟

في السنوات القليلة الماضية ، أظهرت طرق التعلم العميقة نجاحًا هائلاً. إنهم بالفعل يحلون المشاكل التي كانوا يخشون الاقتراب منها من قبل. على سبيل المثال ، حققوا مستوى من الجودة البشرية في تحويل الكلام إلى نص وتحويل النص إلى كلام في التعرف على الصور. ولكن لديهم قيودهم الخاصة التي تمنعهم من المضي قدما. أريد أن أتحدث عن هذا ، وكذلك عن الأساليب التي يمكن أن يتم التحايل عليها. في العديد من النواحي ، لا يزال هذا مجالًا للبحث ، وليس حلولًا جاهزة للاستخدام في العمل اليومي. ومع ذلك ، هناك توقعات معقولة للمستقبل مع تقنيات الذكاء الاصطناعي الأكثر فعالية.

Source: https://habr.com/ru/post/ar411431/


All Articles