نستخدم عادة البحث على الإنترنت ، والتواصل مع روبوتات الدردشة ، وقراءة المستندات بأي لغة بفضل المترجمين. أخبر المكنسة الكهربائية الروبوتية للبدء في التنظيف بصوته؟ لا شيء خاص ... بالنسبة للكثيرين ، دخل المساعدون الصوتيون على الهاتف الذكي الحياة اليومية. إن المستقبل ، الذي يقرأ فيه الكمبيوتر ملاحظة غريبة عن كرة القدم ، يغير من نشرة أخبار الطقس تبعًا لذلك ، وقد حان بالفعل.
كيف يعمل كل شيء؟ كيف تصبح خبيرًا في البرمجة اللغوية العصبية NLP (تعني "معالجة اللغة الطبيعية" ، لا تخلط بينها وبين البرمجة اللغوية العصبية :))؟
أولئك الذين يقيمون في خابروفسك والذين يطرحون مثل هذه الأسئلة ، ندعوك للمشاركة في الدورة التدريبية التي تم افتتاحها مؤخرًا عبر الإنترنت Samsung Research Russia. تحت تفاصيل القط ...
مؤلفو مقرر "الشبكات العصبية ومعالجة النصوص"في يونيو من هذا العام ،
كتبنا عن إطلاق أول دورة تدريبية على الإنترنت بعنوان "
الشبكات العصبية ورؤية الكمبيوتر ". اتضح أنها ناجحة: يوجد بالفعل أكثر من 20 ألف مستمع ، ومراجعات ممتازة ، وحتى حصلنا على جوائز Stepik في سبتمبر لأفضل دورة من مؤلفين جدد لذلك!

لقد مرت 5 أشهر منذ بداية السنة الأولى ، ولم نكن خامعين! من خلال الخبرة المكتسبة والمستوحاة من نجاح الزملاء ، تمكن فريق آخر من المؤلفين - مطوري مركز الذكاء الاصطناعي من سامسونج في موسكو ، وخبراء التعلم الآلي رومان سوفوروف ، وأنستازيا يانينا ، وأليكسي سيلفستروف ، بدعم تحريري مستمر من نيكولاي كابيرين ، من إتقان العمل الهائل ، وفي 15 أكتوبر على قناة " أطلقت شركة Samsung Research Russia Open Education الدورة التدريبية الثانية - "
الشبكات العصبية ومعالجة النصوص ".
تم تصميم الدورة لمدة 7 أسابيع. إذا كنت تقضي ما معدله 3-5 ساعات أسبوعيًا في مشاهدة محاضرات الفيديو ، والإجابة على الأسئلة واستكمال المهام العملية ، فسوف تفهم ما هو تحت غطاء محركات البحث الحديثة ، وبرامج الدردشة ، ومولدات النصوص. بذل الفريق الكثير من الجهود لضمان أنه بعد اجتياز دورة واحدة فقط ، يمكن للطلاب التنقل بثقة في التقنيات على مستوى مطور مبتدئ أو أي أخصائي تقني ليس لديه خبرة محددة في العمل مع البرمجة اللغوية العصبية ، ولكن عليه الآن التعامل معها.
إذن ما هي المزايا المميزة لدورتنا؟
- تم تطويره من قبل مركز سامسونغ للذكاء الاصطناعي ، الذي خلف وراءه حقيبة المشاريع التجارية في هذا المجال
- هناك نظرية وممارسة - سترى كيفية إنشاء شبكات عصبية لمعالجة النص على PyTorch ، وتنفيذ أكثر الهياكل ذات الصلة ومعرفة كيفية تكييفها مع احتياجاتك
- كما هو الحال في السنة الأولى في رؤية الكمبيوتر ، فإن أفضل الخريجين مدعوون لإجراء مقابلة في Samsung Research Russia!
في الرسم التوضيحي أدناه ، قمنا بإيجاز بإظهار المحتوى والخصائص الكمية الحالية للدورة التدريبية الجديدة:

خريجو الدورة يستلمون الشهادات. في هذه الحالة ، هناك خياران ممكنان:
- شهادة عادية ، النقاط التي يمكنك تسجيلها من خلال حل جميع المشاكل إلى الجزء الرئيسي من الدورة ؛
- شهادة مع مرتبة الشرف: لأنها ستحتاج إلى حل جميع المشاكل للحصول على أعلى الدرجات ، وتصفح المسارات النظرية للدورة (هناك مهام مماثلة لتلك التي تم تعيينها للموظفين في المقابلات) وحل المشكلة النهائية في Kaggle.
المعلمين والمطورين بالطبع
برنامج الدورة
1. مقدمةفي هذه الوحدة ، كتقريب أولي ، نتعلم اليوم ما تعنيه معالجة النصوص للتعلم الآلي ، وما هي الصعوبات وما هي مهام علم اللغة اليوم التي لا يمكن حلها إلا عن طريق أساليب التعلم الآلي.
- مرحبا بالجميع! أخبرنا عن نفسك!
- بشكل عام: اللغة الطبيعية والنص
- ميزات معالجة اللغة الطبيعية
- بشكل عام: التحليل اللغوي
- بشكل عام: استخراج الميزة
- تطبيق المهام معالجة النصوص والمجاميع
2. ناقلات نموذج النص وتصنيف النصوص الطويلة
تبدأ الرياضيات. نماذج المتجهات المتفرقة والرموز والمعلومات المتبادلة ... ما هذا كله؟ سنستعرض طرق ترجمة بنية متعددة الأبعاد ومتعددة الأوجه ، موجودة في النص - إلى أرقام حتى تتمكن خوارزميات ML من بدء عملها.
- نموذج النص المتجه و TF-IDF
- إنشاء شبكة عصبية للعمل مع النص
- الأهداف النظرية: نموذج نص المتجهات
- ورشة عمل: تصنيف النصوص الإخبارية
3. أساليب الشبكة العصبية الأساسية للعمل مع النصوصهل نستخدم شبكات عصبية متصلة بالكامل؟ ما هي عملية "الالتفاف على النصوص"؟ يبدو أن عملية للمصفوفات؟ الإجابات في هذه الوحدة ، حيث سنقوم بدراسة المحاولات الناجحة الأولى لتعليم الشبكات العصبية للعمل مع معنى النص.
- خوارزمية عامة للعمل مع النصوص باستخدام الشبكات العصبية
- دلالات التوزيع والتمثيل ناقلات الكلمات
- ورشة عمل: وصفات الطعام و Word2Vec في PyTorch
- الأسئلة النظرية: أساسيات معالجة النصوص من قبل الشبكات العصبية
- الأنواع الرئيسية لنماذج الشبكات العصبية لمعالجة النصوص
- الشبكات العصبية التلافيفية لمعالجة النصوص
- ورشة عمل: وضع علامات على نقاط البيع مع الشبكات العصبية التلافيفية
- الأسئلة النظرية: الشبكات العصبية التلافيفية في معالجة النصوص
4. نماذج اللغة وتوليد النصالغوص أعمق في الشبكات العصبية. يمكن أن يكون النص بأي طول ، لكن الشبكات العصبية المتكررة فقط تسمح للخوارزمية بإنشاء نص بدون حيل خاصة. حاولنا تعليم الشبكة القراءة ، وسنمنحها الآن الفرصة لتكوينها.
- الشبكات العصبية المتكررة
- نمذجة اللغة
- ورشة عمل: توليد الأسماء والشعارات باستخدام RNN
- التجميع آلية الاهتمام
- المحولات والاهتمام الذاتي
- ورشة عمل: نمذجة لغة باستخدام المحولات
- القضايا النظرية: نموذج اللغة والمحولات
5. تحويل تسلسل: 1 إلى 1 و N إلى Mولكن ماذا لو كان الإدخال نصًا ، ويحتاج الإخراج إلى نص؟ هذه وظيفة للمترجم ، الذي ، كما نعلم ، هو السياق الأكثر أهمية. إذا كان يجب عليك ترجمة مجموعة من النصوص إلى أخرى ، أو إلى عدة ، فسوف تمنحك هذه الوحدة كل ما تحتاجه!
- إدراك البنية المسطحة للنصوص القصيرة
- ورشة عمل: وصفة الاعتراف
- ورشة عمل: تحليل الجانب المعنوي كما NER
- تحويل التسلسل (seq2seq)
- ورشة عمل: إنشاء أجزاء من التعليمات البرمجية مع تجاوز سعة المكدس
- أسئلة نظرية
6. نقل التعلم ، والتكيف مع النموذجهل لديك مشروع رائع ولكن لا يوجد لديك موارد حوسبة خارقة؟ ثم خذ شبكة عصبية جاهزة وقم بتدريبها على حل مشكلتك الخاصة! تحتاج إلى معرفة بعض الأسماء وبعض الحيل التدريبية ، والنقطة هي في القبعة.
- تمثيلات سياقية ونقل المعرفة
- ورشة عمل: محولات pytorch أو كيفية تشغيل BERT
- ورشة عمل: بيرت للسؤال والإجابة على البحث
- أسئلة نظرية
7. المنافسة النهائية في Kaggle والختامعن طريق تحريك المؤشر أقرب إلى زر "بدء التدريب" ، هل ترى بالفعل كيف تتكشف السلاسل المتعددة الأبعاد للأحرف الزائفة ويتدفق انتباه الآلة بين المفاهيم؟ ثم تظهر نفسك في المسابقة النهائية لدينا!
- ماذا تقرأ ، كيف تتطور
- مسابقة Kaggle: نظرة عامة على المشكلة والحل الأساسي
متطلبات الطلاب
تم تصميم الدورة للطلاب الذين هم على دراية قليلة في مجال التعلم الآلي.
ماذا تحتاج لبدء الدورة؟
- لديهم المعرفة الأساسية للشبكات العصبية
- لديهم المعرفة الأساسية في مجال الإحصاء الرياضي
- كن مستعدًا للبرنامج في بيثون
يمكننا القول أن الدورة التدريبية "
الشبكات العصبية ومعالجة النصوص " هي استمرار للدورة الأولى في رؤية الكمبيوتر ، لأنها تعتمد على المستوى الأساسي للمعرفة على الشبكات العصبية التي قدمناها بالفعل.
ربما تعرف بالفعل شيئًا ما عن البرمجة اللغوية العصبية - إنه لا يتعلق فقط بتحرير النص ؛ إن إنشاء روبوتات الدردشة وإعادة سرد النص وتصنيف العواطف والإجابة على أسئلة ويكيبيديا هي مهام بسيطة لم تعد تتطلب البحث. ستصبح هذه المهام متاحة لك بعد إكمال هذه الدورة التدريبية. ولكن الأهم من ذلك ، أننا سنعلمك أن تطرح الأسئلة الصحيحة في عالم البرمجة اللغوية العصبية الحديثة ، وما إذا كنت ستجد الإجابات بنفسك أو الشبكة العصبية الخارجية - هل هناك فرق. ما التالي؟ الأمر متروك لك.
هل انت معنا
ثم
مرحبًا بكم في الدورة التدريبية عبر الإنترنت !