دميتري مورومتسيف (ITMO) - حول النمذجة الأنطولوجية وتشكيل الذكاء التحادثي

تحدث ديميتري مورومتسيف ، رئيس المختبر الدولي "الأساليب الذكية لمعالجة المعلومات والتقنيات الدلالية" ، رئيس ITMO ورئيس قسم الإدارة المتكاملة للآفات ، عن جوهر النمذجة الأنطولوجية واستخدام الرسوم البيانية المعرفية في العمليات التجارية وعمل خلق ذكاء المحادثة.



المحاور: آنا أنجيلوفا (أ.
المدعى عليه: ديمتري مورومتسيف (DM)

أأ: ما هو جوهر النمذجة الأنطولوجية وكيف يجري تجميع الرسوم البيانية المعرفية؟

DM: النمذجة الأنطولوجية هي تجميع لنماذج المعلومات في شكل أوصاف مفاهيمية لمجالات موضوعية تفي بمعايير معينة. هناك لغات خاصة لعلم الوجود ، فهي موحدة وتستخدم بالفعل في الصناعة. الهدف الرئيسي لعلم الوجود هو وصف البيانات ومخططات المعرفة التي يمكن أن توجد في مجموعة متنوعة من المصادر. تكمن المشكلة في أن هناك الكثير من هذه المصادر ، فهي تختلف اختلافًا كبيرًا في نوع تخزين البيانات ، في بنية البرامج ، وما إلى ذلك. لتوصيلها في مساحة معلومات واحدة ، هناك حاجة إلى آليات تكامل خاصة - فهي بالضبط الأنطولوجيات. يتم استخدامها عند دمج قواعد البيانات ، ووصف البيانات ذات البنية الضعيفة على الإنترنت ، عند إنشاء قواعد المعرفة حول موضوع معين أو قواعد المعرفة الكبيرة غير المواضيعية - على سبيل المثال ، استنادًا إلى معلومات ويكيبيديا.

تتضمن عملية الإنشاء نفسها مشاركة خبراء المجال: يشارك الخبراء دائمًا في تلك القضايا التي سيتم تقديم البيانات الخاصة بها في عمود المعرفة. على سبيل المثال ، قد تكون هذه قضايا تتعلق بالتراث الثقافي أو الطب أو التعليم أو أي إنتاج.

يحدد هؤلاء الخبراء المفاهيم الرئيسية - الأشياء ذات الأهمية الحاسمة لموضوع معين. على سبيل المثال ، التراث الثقافي هو الأشياء الفنية ، ومبدعو هذه الأشياء ، وعملية الإبداع ، وعمليات الترميم أو نوع من التعديل (إذا كان كائنًا معماريًا ، يمكن إعادة بنائه) ، فهذه قضايا عرض وتخزين وما إلى ذلك. كل ما هو مهم لوصف كامل للموضوع المناطق التي صاغها خبير. يشير كذلك إلى العلاقة ، العلاقة بين هذه الأشياء. يسمح هذا الوصف الرسمي لاحقًا بإجراء استفسارات حول الرسوم البيانية المعرفية.

من الناحية التكنولوجية ، يمكن أن يكون إجراء التحويل معقدًا للغاية ويتضمن العديد من الأدوات: أدوات معالجة اللغة الطبيعية ، والتعلم الآلي ، والتعرف على الأنماط وعددًا من الأدوات الأخرى. في النهاية ، نحصل على شبكة أو رسم بياني للكائنات المترابطة. السمة الرئيسية لهذا النظام ، على عكس قواعد البيانات ، هي أن هذه الشبكة تصف نفسها بنفسها وتوثق نفسها. لا تحتاج إلى توضيحات إضافية من المطور .

أأ: ما هو نطاق الرسوم البيانية المعرفية؟

د.م: أي تقريبًا. الآن هناك رسوم بيانية معرفة للمحتوى العالمي (الأكثر شهرة هو Google) ، هناك Wikidata ، Dbpedia ، والتي تذكرنا بالموسوعة من حيث التغطية. هناك رسوم بيانية معرفية متخصصة: في الطب والتراث الثقافي ، وفقًا لبيانات الدولة المفتوحة. هناك أعمدة المعرفة المؤسسية - فهي في المجال العام.

أأ: أخبرنا عن مشروع داتا فابريك. ما الذي يحتاجونه وما النتائج التي تحققت؟

مارادونا: دعونا نطرح السؤال على نطاق أوسع. مشروع DataFabric هو أحد الأمثلة ، كان لدينا العديد منهم. بدأنا نشاطنا منذ حوالي 8 سنوات. ننفق جزءًا كبيرًا من الوقت على تعميم التقنيات الدلالية ، وإجراء العديد من الأحداث العلمية والتعليمية ، هاكاثونز ، إلخ. نجتمع بانتظام مع ممثلي الصناعة. تُعقد عشرات هذه الاجتماعات سنويًا ، ويهتم ببعض ممثلي الصناعة.

في الوضع مع DataFabric ، عمل متخصصوهم بشكل رئيسي ، والذين استشرناهم من حيث المنهجية وأوصينا ببعض التقنيات والأدوات. قمنا أيضًا بفحص نتائجهم - تحليل لكيفية عمل كل شيء بشكل صحيح. مشروع هذه الشركة نفسها مثير للاهتمام لأنه هو المثال الأول في روسيا عندما استثمرت شركة ما أموالها الخاصة في تطوير الرسوم البيانية المعرفية ، في تطوير تكنولوجيا البيانات ذات الصلة وتمكنت من إثبات أنها يمكن أن تكون مربحة. على حد علمي ، تواصل الشركة استخدام الرسم البياني المعرفي الذي تم إنشاؤه وتخطط لتطويره. من خطابات ممثليها ، يمكننا أن نستنتج أنه بفضل الرسم البياني للمعرفة ، تمكنوا من أتمتة كمية كبيرة من العمل اليدوي. ولكن للحصول على معلومات أكثر دقة ، من الأفضل الاتصال بالشركة مباشرة.

سيرجي إسيف ،
الرئيس التنفيذي DataFabric

أردنا إنشاء نظام تحقق ذكي للطرف المقابل وجمع معلومات الشركة. كنا شركة صغيرة جدًا وأردنا الحصول على ميزة تنافسية. إن منافسينا - Spark Interfax ، Kontur.Fokus - كبيرون جدًا وقويون ، وقد كانوا في السوق لسنوات عديدة ، ومن هذا المنطلق ، "وجهاً لوجه" ، من المستحيل التنافس معهم.

نجمع جميع المعلومات نفسها عن الشركة مثل منافسينا: بيانات من مصلحة الضرائب الفيدرالية ، Rosstat ومصادر أخرى. نقوم بتحميلها في قاعدة بيانات واحدة. نظرًا لأن لدينا رسمًا بيانيًا ، تظهر الروابط بين جميع الكائنات فيه. يستخدم النظام النمذجة الأنطولوجية: نحن نصف له قيمة جميع البيانات التي يعمل معها. لذلك ، تبدأ في فهم السياق ، الحمل الدلالي لبيانات معينة. بفضل هذا ، يمكن حتى أن تطرح عليها أسئلة مفتوحة ، على سبيل المثال: "أرني جميع الشركات التي من المحتمل أن تنهار في العام المقبل." بما أنها تفهم معنى كل كلمة في هذا الأمر ، فإنها ستعطي قائمة.

لا أعرف كم يقضي المنافسون الوقت والمال والجهد لحل مشاكلهم. لكنني أعلم أن لديهم المئات من المطورين ، ولدينا 12 شخصًا فقط ، وأنشأنا نظامنا في عام ونصف. الآن يمكنك من وضع نماذج جديدة بسرعة ، وخدمات جديدة ، لأنها أكثر ذكاءً ومرونة.

أأ: هناك الكثير من الشركاء في موقع المختبر الذي تترأسه. أي منهم يتعاون في المشاريع الجارية؟

د.م: إذا أخذنا التعاون بالمعنى الأوسع للكلمة ، فسيكون مجلس البيانات المفتوحة للاتحاد الروسي هو الأساس من حيث مقدار الوقت المخصص. نحن نحاول تنفيذ العمل المنهجي والبحثي هناك ، بهدف تعزيز الرسوم البيانية المعرفية للسلطات الفيدرالية والهياكل الأخرى المطلوبة لنشر البيانات المفتوحة. الآن شرط القانون لنشر البيانات المفتوحة رسمي للغاية ومحدود. نحن نحاول أن نثبت أنه يمكن القيام بذلك بشكل أكثر كفاءة ، وهذا سيجلب فوائد أكبر بكثير للاقتصاد. كما نتعاون بنشاط في تقنيات التعلم الإلكتروني التعليمية مع الهياكل المختلفة ، وهناك مشاريع بحثية مع العديد من الجامعات في ألمانيا وفنلندا والنمسا.

أأ: ما هي أنشطة الشركات في الصناعة التي يجب مراقبتها؟

د.م: بالنسبة للمجتمع ككل. من الواضح أن الشركات الكبيرة ، إلى حد ما ، مؤشر على مدى نضج التقنيات. ولكن في مؤتمر ISWC الأخير في النمسا - وهذا هو أكبر مؤتمر في العالم حول التقنيات الدلالية - أثار تقرير من Google العديد من الأسئلة: المشكلات التي طرحوها لأنفسهم غالبًا ما تم حلها بالفعل من قبل المزيد من شركات الأبحاث.

بشكل مميز ، لا يقوم اللاعبون الكبار ، كقاعدة عامة ، بالبحث من نقطة الصفر. إنهم يطرحون مشكلة معينة ، ثم يعثرون على فريق يمكنه حل هذه المشكلة ، ويبدأ في التعاون معها أو شرائها إذا كانت نوعًا من الشركات الناشئة. أي أن اللاعبين الكبار أكثر ميلاً للعب دور نظامي.

وإذا كنت تتبع المجتمع ككل ، يمكنك أن ترى العديد من مجموعات البحث المختلفة والشركات والشركات الناشئة التي تقدم الحلول الأكثر ابتكارًا. على سبيل المثال ، هناك الآن اتجاه خطير للغاية في تطوير روبوتات الدردشة وواجهات الصوت والأنظمة الأخرى ، والتي ستصبح بعد فترة من الوقت مساعدين كاملين ومساعدين.

أأ: مختبرك يقوم أيضًا بتطوير مشاريع معالجة الكلام. يشار إلى اثنين منهم على الموقع: اكتمل أحدهما والآخر يستمر. أخبرنا عنهم.

[ملحوظة: "تطوير مورفولوجيا الحاسوب لدراسات الحالة لنص متغير" ، 2015-2016 ؛ "تطوير محلل نحوي للكلام التلقائي الروسي باستخدام طرق استخراج البيانات باستخدام قواعد المعرفة الدلالية" ، 2015-2018]

د.م: بدأ المشروع الأول من قبل مركز تقنيات الكلام - إنشاء مدير حوار ذكي. تلك الحلول الموجودة الآن بدائية للغاية. إنهم يواجهون عندما يتصل العميل بمنظمة أو بنك وعليه أن ينتقل من خط إلى آخر لفترة طويلة. يمكن للأنظمة الأكثر تقدمًا تحليل النص الذي يتم الحصول عليه أثناء التعرف - على سبيل المثال ، Siri و Amazon Alexa. لكن محتوى هذا النص للجهاز لا يزال غير معروف. في روسيا ، بالمناسبة ، تم إطلاق مشروع iPavlov مؤخرًا ، ولكن حتى الآن هناك القليل من البيانات حول نتائجها.

علاوة على ذلك ، بمجرد أن نتعرف على إشارة الكلام ، نحتاج إلى فهم نوع السؤال الذي يحتويه. المشكلة هي أنه عندما يتواصل الناس ، فإن قناة الكلام للتفاعل هي واحدة فقط من عدة قنوات. من الناحية الإعلامية ، فهو ليس الأكثر تحميلا. هناك قنوات للتواصل غير اللفظي ، وهناك معرفة عامة عن العالم ، وسياق يفهمه الشخص ، وما إلى ذلك. في ظل عدم وجود معلومات إضافية ، يكاد يكون من المستحيل فهم ما يدور حوله. إذا أخذنا نصوص النصوص وحاولنا أن نعطيها لشخص ما ، باستثناء السياق تمامًا ، فعلى الأرجح لن يتمكن الشخص حتى من فهمها. لذلك ، نحاول الآن إنشاء أجهزة تحليل تعمل على معالجة الكلام بشكل فعال وتحديد الأشياء والعلاقات بينها - أي إنشاء نماذج معلومات للرسالة الواردة في النص. ويخطط لمزيد من العمل لإثراء هذه النماذج بمعلومات من مصادر أخرى.

أأ: هل يمكنك توضيح ذلك؟ ما الفرق بين اتجاهات البحث للمشروع المنجز والمشروع الجاري حاليا؟

DM: هذه اتجاهات مترابطة. من المستحيل إجراء تحليل نوعي بدون دراسات حالة ، لأنك تحتاج إلى تعليم أنماط الخوارزمية للتعرف على الأنماط في النص. هذا ما فعلناه في المشروع الأول. الثاني يدرس مبادئ تكوين الأشياء. يحتوي النص على وصف لبعض المفاهيم. قد تكون هذه المفاهيم نفسها أكثر إفادة من المعلومات الموجودة عنها في النص. وبناءً على ذلك ، تحتاج إلى الاتصال بقواعد المعرفة والرسوم البيانية الأخرى ومحاولة استكمال هذه المعلومات من مصادر أخرى.

افترض أن أحد العملاء يتصل بالدعم ويتحدث عن مشكلة. لا يجوز له تسمية الجهاز أو عملية استخدام النظام بشكل صحيح. لا يُطلب من المستخدم امتلاك اكتمال المعلومات التقنية. عند فهم السياق ، يمكن للنظام استكمال بيانات المستخدم بمعلومات من مصادره. هذا يبسط إلى حد كبير عملية تحديد المشكلة.

كان المشروع الأول صغيرًا ، وتم تنفيذه بالتعاون مع مركز تكنولوجيا الكلام. لقد أثبتنا في ذلك أن الاستخدام المشترك للأنطولوجيا ، ونظام التعرف على الكلام ، ومحلل النصوص يمكن أن يؤدي إلى تكوين ما يسمى الذكاء التحادثي. لقد أظهرنا بنجاح كبير كيف يعمل هذا. المرحلة التالية هي بحث أعمق في كل من هذه المجالات. في مجال النمذجة الأنطولوجية ، لم نعد نعمل مع الكلام بشكل عام ، ولكن مع المعلومات من الإنترنت في مجال التراث الثقافي: كيفية نمذجه وإثرائه وكيفية إجراء بحث منظم لهذه المعلومات. في مجال التحليل يستمر العمل. لقد حققنا نتائج جيدة في جودة معالجة النصوص.

المرحلة التالية هي مزيج من هذه المجالات وإنشاء نظام لإثراء البيانات من مصادر مختلفة ، بما في ذلك الطرائق غير النصية.

أأ: السؤال الأخير: ما هو تخطيط المختبر للعمل في العام المقبل؟

د.م: تبلور فينا اتجاهان: إنترنت الأشياء والذكاء الحواري. سيصبح الاتجاه الثاني مهيمناً. إنترنت الأشياء هو اتجاه داعم: فهو إنشاء واجهات صوت ونص (روبوتات الدردشة) للتفاعل مع الأجهزة المختلفة ، والروبوتات ، وأنظمة المعلومات.

كل هذا سيجعل التفاعل البشري مع كائنات المعلومات أكثر شفافية وطبيعية.

Source: https://habr.com/ru/post/ar409051/


All Articles