علم البيانات في CodeFest: نكهة الثورة

الصورة

النفس ، في التقريب الأول ، متوازية. الأتمتة حقا يخلق الأنانية. إن أفكار مذهب المتعة هي جوهرية النفعية لميل وبنثام ، ولكن الشك يحول الصراع الظاهري. الكود يبدأ في فهم الجنس.

الراعي للانضمام ياندكس.

لقد اخترقت علوم البيانات والتعلم الآلي حياتنا و CodeFest منذ فترة طويلة ، ولكن لأول مرة نفرد بها في قسم منفصل . لأن هناك المزيد من الأقسام إلى إله الأقسام!

وتعطى الكلمة إلى أمين قسم bond005 . سيكون سعيدًا بمكافآتك المكافئة والكارمية بالمناسبة.

ماذا سيحدث في قسم علوم البيانات؟

قبل الكتابة عن هذا ، سوف أصنع انحدارا فلسفيا صغيرا (صغيرا جدا!).

نحن البشر مخلوقات اجتماعية ، ولا يمكننا العيش دون التواصل: في قاعة اجتماعات المكتب في العمل أو مع كوب من البيرة في حانة مريحة. لكن ليس كل الاتصالات "مفيدة بنفس القدر". هناك مهن - على سبيل المثال ، مشغل مركز اتصال - حيث التواصل مع أشخاص مختلفين ، وأحيانًا لا يكونون ممتعين للغاية ، يشكلون نقطة العمل بأكملها ويستمر يومًا بعد يوم ، أسبوع بعد أسبوع. ثم يتحول التواصل إلى عمل صعب مرهق نفسيا لا يمكن تسهيله أو تشغيله آليا. أو ربما؟

يبدو أنه في هذه الحالة ، لا تحتاج الخوارزمية فقط إلى التعرف على القطة في الصورة من ImageNet ، ولكن لفهم (سماع أو قراءة) ما يريده المحاور ، أو الرد عليه بشكل كافٍ ، "دون جدوى" ، إذا لزم الأمر ، اسأل أو أوضح شيئًا. مهمة صعبة!

ليس سهلا ، ولكن حلها بالطرق الحديثة للذكاء الاصطناعي. وبالتالي ، لم يكن من قبيل الصدفة أن تكون غالبية خطب المتحدثين لدينا في القسم مخصصة للطرق والتقنيات لحل هذه المشكلة.

الصورة هل ستساعدنا الشبكات العصبية في هذا أم لا؟ وما هي ، هندسة الشبكات العصبية الحديثة للنصوص والتواصل؟ هل يمكن لواجهة تقنية المعلومات البسيطة التعامل معها؟ " الشبكات العصبية في معالجة الكلمات: الضجيج أو بجدية ولفترة طويلة؟ "- سوف يخبرنا هذا الأمر متخصص في اللغويات الحاسوبية ، مؤسس مشروع rusvectores.org ، وباحث في جامعة أوسلو ، أندريه كوتوزوف.


الصورة ولكن ماذا لو أردنا تعليم خوارزمية لدينا ليس فقط للقراءة ولكن أيضًا للاستماع؟ كيفية جعل نظام التعرف على الكلام جيد؟ وبشكل عام ، ما هو "الجيد" فيما يتعلق بتكنولوجيا الكلام؟ ما هو "تحت غطاء" جيل جديد من أنظمة التعرف على الكلام؟ هل الكلاسيكيات القديمة الجيدة كافية لنا - نماذج ماركوف الخفية ، أو شبكة عصبية - وهنا "كل شيء لدينا"؟ سيتم إعطاء الإجابات على هذه الأسئلة التي تهم الكثيرين (وأنا بالتأكيد) في قصته بواسطة نيكولاي شميريف ، رئيس AC Technologies وواحد من المساهمين الرئيسيين في فتح مشروع التعرف على الكلام CMU Sphinx و Kaldi.


الصورة حسنًا ، سمعنا شخصًا أو قرأ رسالته ، وتعرّفنا على النص. وكيف نستخلص من النص الشيء الرئيسي الذي أراد محاورنا إيصاله لنا؟ لقد حاولوا حل مشكلة تلخيص النص (الاستخلاص التلقائي) لفترة طويلة. أتذكر أنني كنت ذات مرة تستخدم أحد أنظمة التلخيص لإعداد مقال عن الفلسفة في الجامعة. وماذا عن هذا الآن؟ " تلخيص النصوص: من توليد العناوين إلى الأخبار إلى تلخيص كل شيء وكل شيء " - سيتم تخصيص هذا لعرض دانييل جافريلوف ، وهو مطور ومتخصص في التعلم الآلي من فريق فكونتاكتي.


الصورة وأخيرا ، أدرك الروبوت ما يريده رجل منه. الآن يجب أن يجيب بشكل كاف! ربما لا حتى النثر ، ولكن الشعر! كيفية تطوير خوارزمية يمكنها كتابة النصوص ، وفهم الموضوع الذي تحتاج إلى كتابته بشكل مستقل ، وفي نفس الوقت تقليد الأسلوب الصحيح - من المهم ليس فقط المشاركة في مسابقة شعر ، ولكن أيضًا لإنشاء روبوت دردشة مثقف وثقافي يتواصل مع العملاء في الأعمال المصرفية مركز الاتصال على سبيل المثال. أنيا موسولوفا من جامعة ولاية نوفوسيبيرسك في قصتها القصيرة " تقليد شاعرة ، أو كيف سيكتب بوشكين في مائتي عام " ، ستقدمنا ​​إلى "حشو" الخوارزمية لمولد للنصوص باللغة الروسية يمكن أن يكون له معنى وقافية!


الصورة كل هذه المواضيع ، التي سيتم الكشف عنها بواسطة متحدثين رائعين لدينا ، مهمة للغاية سواء على حد ذاتها أو لبناء روبوت دردشة حديث. من حيث المبدأ ، بعد الاستماع إلى قصصهم والتحدث إليهم في منطقة الخبراء ، يمكنك بالفعل إجراء (أو محاولة إجراء) الدردشة الخاصة بك مع الذكاء الاصطناعي الذي يمكن أن يواصل المحادثة حتى حول أنواع البيتزا ، على الأقل الفائدة على القروض المصرفية.

لكنني لا أريد تصميم وبرمجة كل شيء بنفسي ، حتى لو كنت تستخدم مكتبات البرامج الموجودة (والتي ، بالمناسبة ، سوف تسمع عنها أيضًا في القصص ، لأن المصدر المفتوح مقدس)! ربما هناك بعض الحلول الجاهزة أو قوالب الحلول لبوت الدردشة ككل ، وليس فقط لمكوناتها الفردية؟ في تقرير فلاديسلاف ليالين ، مطور مختبر النظم العصبية والتدريب العميق في MIPT ، سوف تسمع "نعم" حاسمة كإجابة على هذا السؤال. سيقدمك فلاديسلاف إلى مشروع الذكاء الاصطناعي للمحادثة في iPavlov ومكتبة DeepPavlov python ، والتي هي في الواقع منصة مفتوحة لإنشاء مجموعة متنوعة من أنظمة الحوار: روبوتات الدردشة المستهدفة ، وروبوتات أسئلة الإجابة ، وروبوتات أسئلة وأجوبة الدردشة ، إلخ.


الصورة وأخيرًا ، ليست "علوم البيانات" هي الوحيدة التي تحادث الذكاء الاصطناعي! حول رؤية الكمبيوتر وينبغي أيضا أن نتذكر. يدور حول هذا - حول الرؤية المكانية والتصميم التلقائي لموقع الأشياء في العالم ثلاثي الأبعاد - سيكون هناك قصة من قبل أليكسي Grishchenko ، مهندس شركة نوفوسيبيرسك موتيف. لقد فاز أليكسي وزملاؤه مؤخرًا بمسابقة رؤية للكمبيوتر ، حيث كان من الضروري إنشاء وتدريب شبكة عصبية كانت تعرف تمامًا العملية الكاملة لتجميع شاحن توربيني من طراز KamAZ وتمكنت من التحكم في العمال على خط التجميع حتى لا يثبطوا. لكن بعد النصر ، لم يستقر أحد على أمجادهم ، واستمر تحسين النظام! تريد أن تعرف كيف؟ تعال إلى أداء أليكسي!


الصورة وتحتاج أيضًا إلى تذكر أساسيات - تقنية التعلم الآلي! بغض النظر عن ما تحله الشبكة العصبية - فهي تحلل النص أو تحدد الكائنات الموجودة في الصورة ، يجب تدريب هذه الشبكة العصبية. كلما زادت كمية بيانات التدريب ، أصبحت هذه الشبكة العصبية أفضل وأكثر ذكاءً ، لكن التعلم باستخدام البيانات الضخمة يصبح صعبًا للغاية من الناحية التكنولوجية. سيتحدث ليونيد كوليجين ، مطور ومتخصص في التعلم الآلي من Google Cloud في ميونيخ ، عن كيفية حل مشكلة البيانات الكبيرة في تدريب الشبكات العصبية الحديثة ، وكيف يعمل التعلم الموزع مع مكتبة الشبكات العصبية المعروفة TensorFlow ، وكيف يتم ترتيب معالجة البيانات والأدوات المتاحة للتدريب على التوصيفات .

تعمل استراتيجية التسعير على استعادة مبدأ الإدراك لدى المستهلك ، وتحسين الميزانيات. تراقب الحركة الفورية نطاق المنتجات بشكل موحد. بمعنى آخر ، أيها الأصدقاء ، أولاً ، منذ 4 مارس ، ارتفع السعر ، وثانياً ، قاموا بإعداد البث عبر الإنترنت .

الاتصالات لا تقدر بثمن ، وحتى AI المنطوقة سوف توافق!

التسجيل مطلوب. المشاركة أيضا. تعال ، سيكون رائع!

Source: https://habr.com/ru/post/ar441072/


All Articles