
من 29 مايو إلى 1 يونيو ، سيعقد المؤتمر العلمي الدولي الخامس والعشرون حول اللغويات الحاسوبية والتكنولوجيات الفكرية "
الحوار " في الجامعة الإنسانية الحكومية الروسية (RSUH). حول ماهية "الحوار" ولماذا ABBYY هو المنظم الرئيسي لها ،
تحدثنا بالفعل
عن حبري . في هذا المنشور ، سنتحدث عن الموضوعات الرئيسية للمؤتمر والمتحدثين الرئيسيين وتقاريرهم وأربع مسابقات لإنشاء أنظمة تحليل النص التلقائي في إطار
تقييم الحوار .
هذا العام ، سيكون للحوار العديد من الموضوعات الرئيسية:
- استخدام الشبكات العصبية لتحليل اللغة . من المقبول عمومًا أن التعلم العميق هو تحويل البيانات الأولية إلى نتيجة (ما يسمى النهاية من النهاية إلى النهاية) ، والتي يصعب فيها تفسير "منطق" إنتاجها بمفاهيم لغوية ذات معنى. لكن لماذا لا تستخدم الشبكات العصبية لاكتساب المعرفة باللغة نفسها؟
- استخدام نماذج لغوية أكثر تعقيدًا في التعلم العميق . هناك اتجاه مهم آخر للحوار: نماذج التوزيع ( حفلات الزفاف ) تتطور بشكل واضح من طرق " المستشفى المتوسطة" للحصول على - إلى استخدام السياق ، والمعلومات النحوية والدلالية.
- تطبيق طرق تحليل البيانات الضخمة على المهام التي توجد بها بيانات قليلة . تم إعلان 2019 السنة الدولية للغات السكان الأصليين ، وبالتالي ، سيناقش المشاركون في إحدى جلسات الحوار طرق استخدام التعلم الآلي لوصف والحفاظ على اللغات "منخفضة الموارد" (على سبيل المثال ، Evenki أو Selkup).
- السلك المتعدد القنوات : يوجد اليوم ميل لدراسة الفعل الكلامي ، بما في ذلك الجزء اللفظي ، التجويد ، تعبيرات الوجه ، الإيماءات. مثل هذا البحث مهم بشكل خاص عند تدريب الروبوتات والمساعدين الأذكياء وروبوتات الدردشة.
يتم دعوة
الخبراء الدوليين المشهورين في اللغويات الحاسوبية إلى الحوار. يحضر المؤتمر هذا العام:
كريس بيمان من جامعة هامبورغ. أحد كبار المحللين في مجال دلالات الكمبيوتر. سيتحدث عن تقنيات تعلم الآلة التكيفية التي تأخذ في الاعتبار التجربة الفردية. 31 مايو (الجمعة) ، 3 مساءً - 4 مساءً
بيك فوسن من جامعة أمستردام الحرة ، مؤسس ورئيس رابطة WordNet العالمية. مجال اهتمامه الرئيسي هو التفاعل اللفظي بين شخص وجهاز كمبيوتر. سيقدم Peak Vossen عرضًا تقديميًا عن "روبوت تواصلي يدرس الناس والعالم". سيتحدث عن نموذج روبوت يتعلم معلومات حول العالم ومحاوريه من خلال التواصل باللغة الطبيعية. يتعلم الروبوت كل ما يخبره الناس به ، وما يلاحظه في المواقف المختلفة ، وكل ما يعثر عليه على الإنترنت. 30 مايو (الخميس) ، 3 مساءً - 4 مساءً
في المجموع ، سيقدم "الحوار" 102 تقريرًا عن المسار الرئيسي وحوالي 20 تقريرًا للطالب.
في 29 مايو ، في اليوم الأول من المؤتمر ، سيقدم المتحدثون التاليون عروضًا :
أندريه كيبريك ، مدير معهد اللغويات في الأكاديمية الروسية للعلوم. وسيقدم عرضًا تقديميًا عن أساليب الإحضار الجديدة التي أنشأتها مجموعته البحثية لإصلاح عناصر التواصل وإيماءات التواصل. 29 مايو (الأربعاء) ، 10: 30-11: 50.
سيتحدث إيغور بوغوسلافسكي ، الأستاذ بجامعة مدريد التكنولوجية ، وزملاؤه عن كيفية تدريب جهاز كمبيوتر على تحليل ما يعرف باسم "مخططات فينوجراد" هي تجربة جديدة وأكثر تعقيدًا من اختبار تورينج التقليدي ، وهي طريقة لتقييم قدرات أنظمة الذكاء الاصطناعي على فهم اللغة. 29 مايو ، 12: 20-13: 30.
فالنتينا أبريسيان ، أستاذة في كلية الصحة والسلامة والبيئة. إن تقريرها مخصص
للآثار : لم يتم التعبير عنه صراحة ، ولكن المعنى والافتراضات المستمدة من النص. تسمح دراسة الآثار ، خاصةً الآثار الخاطئة ، على سبيل المثال بتحديد المنشورات غير العادلة في وسائل الإعلام. 29 مايو ، 12: 20-13: 30.
سيكون هناك العديد من الأشياء المثيرة للاهتمام في أيام أخرى. حسب التقاليد ، يولي الحوار اهتمامًا كبيرًا للقدرات التعبيرية الجديدة للغة. على سبيل المثال ،
ستقوم ماريا بولينسكايا من جامعة هارفارد
وإرينا ليفونتينا من معهد OJ بتحليل التعبيرات العاطفية التي أصبحت شائعة في خطابهم ، مثل "لقد استخدموا صيغة المصدر" (بالمناسبة ، هذا هو اسم التقرير. يمكنك الاستماع إليه في 30 مايو ، 10: 00-13: 30 ).
أنتونينا لابوشينا من معهد بوشكين في تقريرها "هل تعتقد أنه بارد؟" يحلل التكوين اللغوي للكتب المدرسية للغة الروسية للمدارس الابتدائية - من وجهة نظر علماء اللغة الحديثين (29 مايو ، 15: 00-18: 30).
بالطبع ، يخصص الكثير من العمل للموضوع الساخن وهو تطبيق الشبكات العصبية لمشاكل تحليل اللغة. على سبيل المثال ، في 31 مايو ، تم تخصيص قسم خاص من الحوار لمجالات مهمة من البحث مثل نماذج اللغة في التعلم العميق والتعلم الانتقالي ، إلخ.
- في 30 أيار (مايو) ، الساعة 19:00 ، ستُعقد مائدة مستديرة حول إمكانات صياغة خطاب في تفاعل شخص ما مع جهاز كمبيوتر. يتطور هذا الاتجاه بسرعة ، وليس من السهل على اللغويات متعددة الوسائط التحليلية مواكبة ما تسمح به الأساليب الحديثة في تحليل المصفوفات الضخمة من المعلومات السمعية البصرية.
- 31 مايو ، الساعة 19:00 ، ندعوك إلى اجتماع المائدة المستديرة " Brave New DL Word: أين هو مكان البرمجة اللغوية العصبية؟ ". سيناقش المشاركون في الأطروحة "الاستفزازية" بأن "البرمجة اللغوية العصبية" اليوم "تُحل" في تقنيات التعليم الآلي العميقة وتفقد مكانة الانضباط العلمي المستقل. بالطبع ، لن يتفق العديد من الباحثين مع هذا البيان ، وسنتوقع ظهور مظاهر مثيرة من قبل المعارضين.
أحد الأحداث الرئيسية للحوار هو تلخيص المسابقات التكنولوجية بين مطوري أنظمة التحليل اللغوي للنصوص
تقييم الحوار . أقيمت مسابقات هذا العام في أربع مهام:
- التلقائي جيل من عناوين الأخبار.
- التحليل التلقائي للغات منخفضة الموارد (عندما يكون هناك القليل جدا من البيانات للتعلم الآلي) ؛
- الاستبانة التلقائية للجناس وتحديد سلاسل المراجع (إشارات متنوعة لنفس الكائن في النص) ،
- الاسترداد التلقائي للكلمات حسب السياق (بعض أنواع القطع الناقص).
لإجراء مثل هذه المسابقات ، كالعادة ، كان من الضروري إنشاء بيانات معدة خصيصًا (مجموعات البيانات) لتدريب الخوارزميات المختبرة. ليست هذه هي المرة الأولى
التي تشارك فيها
تقنيات ABBYY في إنشاء مجموعات البيانات هذه كجزء من المنافسة
على تحليل النصوص باللغة الطبيعية . هذا سمح لنا بزيادة حجم المرفقات نظرًا للكمية الكبيرة من المعالجة المسبقة التي قام بها الكمبيوتر. بمزيد من التفاصيل ، سنخبرنا عنها قريباً على حبري. سيتم تلخيص نتائج تقييم الحوار في "الحوار":
- 30 مايو ، 10: 00-13: 30 ، جلسة خاصة بناءً على نتائج اختبار أنظمة المعالجة التلقائية لرسم خرائط القطع.
- 31 مايو ، 10: 00-13: 30 ، جلسة خاصة تستند إلى نتائج اختبار أنظمة تحليل الجناس وجلسة خاصة تعتمد على نتائج اختبار أنظمة توليد عناوين الأخبار
- 1 يونيو ، 10: 00-13: 30 ، جلسة خاصة على أساس أنظمة الاختبار لوصف اللغات منخفضة الموارد.
لغات العمل في المؤتمر هي الروسية والإنجليزية. برنامج مؤتمر مفصل متاح
هنا .
ستُنشر وقائع المؤتمر في الكتاب السنوي "
اللغويات الحاسوبية والتقنيات الذكية " ، والذي يعد جزءًا من نظام
Scopus الدولي للاستشهاد.
يمكنك التسجيل
هنا ، يستمر التسجيل حتى 28 مايو.
شروط المشاركة .
إليزابيتا تيترينكو ، رئيسة تحرير مدونة الشركات ABBYY
بمشاركة فلاديمير سيليغي ، مدير الدراسات اللغوية في ABBYY