حل مشكلة فهم سياق الذكاء الاصطناعي. الجزء الأول



يعد فهم اللغة الطبيعية مهمة كاملة لمنظمة العفو الدولية . أحد جوانب هذا الفهم هو فهم السياق. في هذه المقالة ، سأشرح أنواع السياق التي يضعها عقلنا جانبًا ، وكيف يعمل مع نوع واحد من السياق ، وكيف نعيد إنشاء هذه العملية في تقنية الذكاء الاصطناعي لدينا.

الكأس لا يتناسب مع الحقيبة البنية لأنه صغير جدًا / كبير.
ما هو أيضًا [صغير / كبير]؟
أجوبة: الحقيبة / الكأس.
تحدي مخطط فينوغراد

في مقال سابق يصف نهجنا في تطوير AI وما قمنا به حتى الآن. دعني أذكرك بأننا نقوم بإنشاء الذكاء الاصطناعي من خلال نسخ هياكل وعمليات النفس البشرية بشكل مباشر.

نوعان من السياق


من التعليقات على المقالة السابقة ، رأينا أن مصطلح "سياق" يستخدم لوصف مواقف مختلفة للغاية. نعتبر هذا المصطلح مقسمًا إلى نوعين.

النوع الأول من السياق هو عندما يتعلق الأمر بالفهم الناشئ عن المفاهيم المعبر عنها في هذه العبارة. هذه هي حالات اختيار أحد معاني الأسماء المختصرة ، واختيار المرادف ، واختيار الفروق الدقيقة في المعنى ، إلخ. على سبيل المثال: "كانت عينيها مائيتين عندما كانت تقطع البصل من أجل سلطة" و "الرماية الحديثة مقسمة إلى عدة اتجاهات". يفهم الشخص "على الطاير" عندما يتعلق الأمر بالبصل والنباتات ، وعندما يتعلق بالبصل - مجموعة متنوعة من الأسلحة.

النوع الثاني من السياق هو عندما يكون من الضروري لفهم تحديد فئة معينة ، غالبًا ما لا تكون ممثلة في النص نفسه أو لا يتم تمييزها بشكل خاص. هذه الفئة هي التي تسمح لنا بصياغة "فكرة" معينة ، وتعميم التعبير عما يقال.

على سبيل المثال ، إذا صادفت في كتاب ليف تولستوي عبارة "طبع حرفًا ..." ، من أجل الفهم الصحيح للنص الذي تستخدمه فئة "القرن التاسع عشر" واستنتج أن هذا لا يتعلق بالطابعة. يشير هذا النوع من السياق إلى أنه لفهم النص وتفسيره ، لا يمكن تحليل النص بأكمله فحسب ، بل يمكن أيضًا تحليل البيانات المرتبطة به.

يتم حل المشكلات المرتبطة بأنواع مختلفة من السياقات من خلال عمليات عقلية مختلفة تمامًا. نكرر نفس التقسيم في تطوير الذكاء الاصطناعي. في حل مشاكل النوع الأول ، يتم استخدام طريقة بناءً على ميزات تخزين المعرفة. في حل مشاكل النوع الثاني ، يتم تنفيذ خوارزمية أكثر تعقيدًا تعتمد على الخبرة (في حالة الذكاء الاصطناعي ، نتحدث عن خوارزميات تعوض نقص الخبرة البشرية الحقيقية في النظام) وتقترح قدرًا أكبر من الحساب.

النفس البشرية غالبا ما تحاول أولا تطبيق الطريقة الأولى ، لأن يتطلب موارد حوسبة أقل بكثير. إذا كان الحل لا يبدو ملائمًا ، فإن النفس تستخدم الثانية. بالإضافة إلى ذلك ، كلما زاد مستوى الذكاء ، كلما تم استخدام الطريقة الثانية في كثير من الأحيان وزاد عدد السياقات المحتملة التي يتم أخذها في الاعتبار. يفضل الأطفال ، بالنظر إلى تعقيد وكثافة الموارد في الطريقة الثانية ، وكذلك البالغين الذين لم يعتادوا على العمل العقلي ، الأول.

سنصف كيف تعمل تقنية الذكاء الاصطناعي لدينا مع النوع الأول من السياق. سيتم وصف كيفية عملنا مع الثانية الأكثر تعقيدًا في المقالة التالية.

الأطول هو أن الجديل لديه روابط أقل


للتوضيح ، لنأخذ موقف حوار:

"أنا أمشي على طول المنتزه ورأيت المنجل. أتساءل أي جديلة هو الأطول؟ "

الحل المبني على الشبكات العصبية ، بسبب القيود التي تفرضها الطريقة نفسها ، على الأرجح لن يكون قادرًا على الاستجابة بشكل مناسب. حتى إذا تم تحميل الكثير من النصوص في الجمعية الوطنية للبحث عن إجابة ، فبناءً على الاحتمال ، سيبدو الرقم "5.6 متر".

دعني أذكرك بأننا نطور تقنية الذكاء الاصطناعي من خلال نسخ النفس وعملياتها بالتتابع. تعكس الشبكة الدلالية التي نستخدمها لتخزين المعرفة خصوصيات التخزين البشري ومعالجة المعلومات. لذلك ، في إطار نهجنا ، يتم حل المشكلة بكل بساطة.

في حل يتوافق مع سن السابعة ، تصل الخوارزمية إلى الشبكة الدلالية وتعثر على الرأس الموجود في العقدة التي تنتمي إليها الكلمات التي سمعت سابقًا. في المثال أعلاه ، من الضروري اختيار أحد الأسماء المختصرة بشكل صحيح: جديلة (تصفيفة الشعر) وجديلة (شريط أرضي متصل بالساحل) جديلة (أداة). للقيام بذلك ، يتم تحليل عقدة الشبكة الدلالية التي نوقشت في وقت سابق. على سبيل المثال يتم تنفيذ أبسط إجراء لحساب المسافة الدنيا إلى المفاهيم المستخدمة في النص في وقت سابق. في شبكتنا ، المسافة هي دالة لعدد الاتصالات (بنسبة مباشرة) واحتمالها (عكسيا).

ستكون المسافة من "جديلة (شريط الأرض)" إلى "السد" أصغر بمرتين من الحجم من "جديلة (تصفيفة الشعر)" إلى أي من هذه المفاهيم. ستعطي منظمة العفو الدولية الجواب "110 كم".

وتجدر الإشارة إلى أن هذه المشكلة يتم حلها أيضًا في الطريقة الثانية ، مع فصل الفئة ، على سبيل المثال ، "نهر الفولجا ، بجوار محاورنا".

يرى المحركون الحقائب بشكل مختلف


دعونا نلقي نظرة على مثال من مخطط فينوهراد في بداية المقال:

"الكأس لا تتناسب مع الحقيبة البنية لأنها صغيرة جدًا. ما هو صغير جدا؟ "

العلاقة بين "غير مناسب" و "الصغير" - "حقيبة" هي مرتبة من حيث الحجم أكثر احتمالا من بين "غير مناسب" و "صغير جدا" - "الكأس". ستعطي منظمة العفو الدولية الجواب "حقيبة".

إن وجود احتمالية عالية لمثل هذه العلاقة ، التي تفترض أن ترتيبًا لمسافة أصغر في السلسلة "لا تتناسب" - "صغيرة جدًا" - "حقيبة" ، يرجع إلى التجربة البشرية. مثل معظم الناس ، صادفت غالبًا موقفًا لا يتناسب فيه شيء مع حقيبة ، نظرًا لأنه صغير جدًا. وبالتالي ، لدي مثل هذا الاتصال. يتم تكوين نفس الروابط في عملية تعلم الذكاء الاصطناعي (سنصف بمزيد من التفصيل حول تشكيل أنواع مختلفة من الاتصالات في النفس في إحدى المقالات التالية حول شبكتنا الدلالية).

"الكأس لا يتناسب مع الحقيبة البنية لأنها كبيرة جدًا. ما هو الحجم الكبير؟ "

العلاقة بين "غير مناسب" والجمع بين "كبير جدًا" - "الكأس" أكثر ترجيحًا من بين "لا يصلح" و "كبير جدًا" - "حقيبة". ستعطي منظمة العفو الدولية الجواب "الكأس".

ألاحظ ميزة - في المحرك ، الذين يواجهون غالبًا موقفًا عندما تحتاج إلى وضع حقيبة كبيرة جدًا ، تستخدم النفس الطريقة الثانية لفهم السياق. لأن بالنسبة لهم ، فإن الارتباط "كبير جدًا" - "حقيبة" أكثر صلة. في الوقت نفسه ، يعمل نظام آخر للسياح - إلى جانب زيادة تجربة المواقف عندما يكون من الصعب وضع حقيبة في مكان ما ، تزداد استحالة البناء "لا يمكنك وضع شيء في الحقيبة لأن الحقيبة كبيرة جدًا".

بالنسبة للحل المقابل لـ 12 عامًا ، تكون الصيغة أكثر تعقيدًا إلى حد ما. علاوة على ذلك ، يتم تطبيق النهج الذي شكله هذا العمر أيضًا عند البالغين - بعد 12 عامًا ، لا يصبح هذا الجزء من شبكة الخوارزميات أكثر تعقيدًا.

في الواقع ، يتم تحديد سهولة اتخاذ القرار من خلال تفاصيل رحلتنا. يتم تشكيل جميع الحالات المتعلقة بالاتصال ، وجميع اللغويات ، بمشاركة هياكل النفس البشرية. في الواقع ، يتم تحديد جميع التفاصيل في مجال اللغة من خلال هذه الهياكل. صحيح ، هناك عملية عكسية ، عندما تحدد اللغة البنية. هناك ارتجاج متبادل. ليس من المستغرب أنه بمساعدة هذه الهياكل (العقلية) يتم حل المشاكل التي تنشأ في أسهل طريقة. يجب أن يتم فك الجوز بمفتاح ، يتم إنشاؤها لبعضها البعض. لا ملعقة.

وألاحظ أنه بالإضافة إلى المزايا العظيمة ، فإن نهجنا في تطوير الذكاء الاصطناعي يطرح بعض الصعوبات. لا تتوافق العمارة الحسابية مع القاعدة الفسيولوجية ، ونحن نحل بشكل دوري المشاكل التقنية للعرض النوعي لعمليات وهياكل النفس في شكل رقمي. أيضًا ، نظرًا للافتراضات والتعديلات الحالية ، يتم إنفاق بعض الموارد لضمان هوية الشبكة الدلالية وخوارزميات الذكاء الاصطناعي لهياكل وخوارزميات النفس الحقيقية.

ستتناول المقالة التالية النوع الثاني من السياق ، ولسوء الحظ ، ستكون أثقل بكثير. لا يمكننا الاستغناء عن الانغماس العميق في العمليات النفسية عند وصف الخوارزميات للعمل مع النوع الثاني من السياق في تقنيتنا.

Source: https://habr.com/ru/post/ar399111/


All Articles