قاموس ويليام شكسبير هو 12000 كلمة. قاموس الزنجي من قبيلة آكلي لحوم البشر "Mumbo-Yumbo" هو 300 كلمة. Ellochka Schukin من كتاب "12 كرسيًا" بسهولة وثمن تكلفة ثلاثين.
يفهم الرجل بسهولة Ellochka. للأسف ، يفضل شكسبير فهم الكمبيوتر من Ellochka. يكفي أن نفهم السياق والتجويد - سنكتشف الباقي - ويحتاج الكمبيوتر إلى الوضوح في كل مصطلح. يفضل بدون مرادفات. كلما زاد عدد الصور المخفية وراء كل كلمة ، زادت صعوبة فهمها. طبيعة الكلمات البشرية التي تعتمد على السياق ليست سوى واحدة من الصعوبات في تدريس الذكاء الاصطناعي في اللغة الطبيعية. إذا كان بإمكانك تمييز البصل الصالح للأكل من تصوير البصل إذا كان لديك وصف كامل للموقف ، فإن إنكار المعنى عن طريق الأسئلة الساخرة أو البلاغية يتم التعرف عليه فقط من خلال التجويد. يؤدي بناء الجملة وترتيب الكلمات في الجملة إلى تعقيد إضافي.
ومع ذلك ، قرر إيغور مورداش ، أحد موظفي مختبر OpenAI الأمريكي للذكاء الاصطناعي ، أن لغة Ellochkin ليست بعيدة عن طريق مسدود ، ولكنها مثال مناسب جدًا ، حيث ستبنى الروبوتات لغة لتواصلها ، وبعد ذلك سيفهموننا. فقط 30 كلمة للكمبيوتر Ellochka ندم. في
تجربته ، أنشأ برنامج الكمبيوتر اللغة من الصفر.

بحثا عن لغة عالمية للتواصل مع الآلات
تسمح لنا دقة التعرف على اللغة الطبيعية الآن بين قادة الأنظمة المعرفية (IBM Watson و Google و ABBYY و Microsoft و Nanosemantics) بفهم المعنى والإجابة عن سؤال مكتوب بشكل عام بقاعدة معرفة موضوعية محددة مسبقًا ، ولكن المحادثة حتى مع دقة التعرف على العبارة 90٪ هي في الواقع متعب جدا. كلام المحادثة ، المشبع بالمداخلات وغالبا ما يحدث في شركة كبيرة مع تقاطع الحوارات ، يضع الروبوت في قدرته على الحفاظ على المحادثة على مستوى طفل عمره ثلاث سنوات.
إن قدرة البرامج على الاستجابة بدقة لمعنى العبارات من شأنه أن يحل العديد من مشاكل الواجهة ، مما يعني ربط برامج الروبوت (وكلاء الذكاء الاصطناعي) بأي مهمة بشرية يومية. هناك حوار مع الآلات حتى الآن - التلفزيون ، على سبيل المثال ، يتواصل بلغة التحكم عن بعد. لكنه يفهم القليل من الفرق. ولا يفهمها إلا بعد البرمجة. يتضح من هذا المثال البسيط أنه من أجل التواصل السريع والمرن مع البرامج والأجهزة متعددة الأغراض (على الأقل الروبوتات) ، يجب إزالة الوسطاء من الحوار. من بينهم ، للأسف ، المبرمجين.
يربط المتفائلون في اللغويات الحاسوبية الآمال بالشبكات العصبية. في فهمهم ، المشكلة الوحيدة هي الحاجة إلى معالجة عدد كبير من الأمثلة. يعتبر المعارضون المهمة غير قابلة للحل. ليس كثيرًا بسبب حجم التدريب ، ولكن بسبب معادلة هذه المهمة لمهمة خلق الوعي في الآلات. يفسر كل طرف أمثلة على حساب الدلافين أو توصيل القرود لصالحها - بعضها كمنظور ، والبعض الآخر كطريق مسدود. للمهتمين بتفاصيل عن حبري وجي تي هناك العديد من المنشورات حول اللغة الطبيعية. على سبيل المثال ،
"مقدمة إلى التعرف على اللغة الطبيعية" .
موضوع هذا المنشور هو النهج الثالث ، الذي اعتمده إيغور مورداخ كأساس - دع الآلات نفسها تتعلم أولاً التواصل باللغة التي تنشئها. ستسمح عملية تطوير لغتك لوكلاء برامج الذكاء الاصطناعي بفهم الخوارزمية بشكل أفضل لضبط المصطلحات حسب المعاني الجديدة وقواعد تكوين العبارات واستخدام هذه المعرفة لإجراء محادثات مع الأشخاص. هذا هو بالضبط ما حدده Mordach ، الذي عمل سابقًا كمتخصص في إنشاء أبطال أفلام متحركة متحركة ، المهمة. مع وضع هذه الخلفية في الاعتبار ، قرر إيغور أن التدريب في الحركات يحتوي على خوارزميات لجمع المعلومات واستخدامها الجزئي المتزامن ، والذي يمكن استخدامه في أي تدريب.
لتعليم البوتات لغة البوتات (وكلاء البرمجيات) ، وضعوها في الكون الشرطي لـ "المربع الأبيض" ، وحددوا لهم الأهداف ، وطاقة الحركة والقدرة على معالجة تجربة ربط أنفسهم بالهدف. في البداية ، كان لدى برامج الروبوت مجموعة صغيرة من أوامر العمل ، والخبرة الشخصية للنجاح ، وأعطت أيضًا طريقة لتبادل المعلومات - من خلال "الاتصال اللمسي" أو من خلال نموذج أولي بعيد "السمع والبصر" (هنا من الأنسب استخدام مصطلح اتجاه تدفق المعلومات). كان الغرض من البوتات في الكون الشرطي لـ "المربع الأبيض" هو الوصول إلى نقطة معينة بنفسك ، وإبلاغ هدفك إلى وكيل آخر ، وتبادل الأهداف ، ودفع وكيل آخر إلى الهدف في غياب تبادل المعلومات بينهما. اختلفت الأهداف والروبوتات في اللون أو الحجم.
بالنسبة للعامل سميث ، ستبدو المصفوفة ، عندما أنشأها موردخ ، على النحو التالي:

في تجربة OpenAI ، كانت المعلمة المقاسة لنجاح التجربة والخطأ هي حقيقة وسرعة تحقيق الأهداف. يمكن أن تكون عدم تحرك أو تحرك نقطة معينة (الاتصال المباشر مع الهدف أو الاتصال من خلال وكلاء آخرين) في العالم الافتراضي للمربع الأبيض. كلما تم تحقيق الهدف بشكل أسرع ، كلما تم التعرف على قائمة المصطلحات المستخدمة في مربع حوار الأهداف الحالي. كانت الأهداف والنجاح فردية وجماعية.
في عملية استكمال المهام ، أثرت البوتات الاحتياطي اللغوي بمفاهيم جديدة تتوافق تقليديًا مع المفاهيم البشرية - من مصطلحات الحركة إلى المفاهيم: أعلاه ، أدناه ، إلى اليمين ، إلى اليسار. يأمل موردخ أنه من خلال وضع القواعد الخاصة بتكوين الكلمات ، يمكن للبوتات بسهولة "فهم" نفس القواعد في اللغات البشرية. بما في ذلك تعلم دقة استخدام مصطلحات مقارنة وغير محددة. لدى منظمة العفو الدولية فهم ضعيف للمصطلحات المجردة والمعممة. بتعبير أدق ، لا يفهم أي شيء على الإطلاق ، لكنه مستعد للعمل مع بعض العبارات ، وبالنسبة للآخرين ، من الضروري الحصول على معلومات توضيحية. في عبارة "تسير السيارة بسرعة" على الأقل كلمة "سريع" - يجب قياسها. حتى من حيث قواعد المرور ، لا يزال "السريع" عبارة عن مجموعة من القيم التي تتناسب مع بعض الفواصل الزمنية. بتعبير أدق ، عدة فواصل زمنية - للمدينة ، الطرق السريعة والمناطق الريفية.
الشبكات العصبية ، بالطبع ، قادرة على العمل بعبارات غامضة ، ولكن تدريبها عادة لا يبدأ من نقطة الصفر ، ويحتوي على عدد من قواعد معالجة البدء ، ولا يعتمد أيضًا على تراكم تجربة الإشارة على نوع القناة التي يتم من خلالها إرسال المعلومات. هذه هي المستجدات الرئيسية لتجارب موردخ.
مقارنة الاتصالات البعيدة والاتصالات الملموسة للبوتات:


إن نقص الجسم والحدود يجعل كل هذه الشروط مشروطة ، بالطبع.
نقطة ملحوظة هي أن نجاح كل بوت تم حسابه على أنه جزء من نجاح جميع الروبوتات ، مما يشجع التعاون في تحقيق الهدف. أي ، تم تقدير جودة المفردات من خلال مجموع اللغة المستخدمة. اتضح أن شخصًا ما كان عليه بالضرورة جمع الظروف الثانوية لتحقيق الهدف والإبلاغ عنها ، والتي في حالة تحقيق كل فرد للأهداف من قبل كل ناقل من شأنه أن يمنع تحقيقها. تعمل القاعدة الإحصائية 20/80 - تلقي 20٪ من المعلومات على 80٪ من تحقيق الهدف - تعمل على مستوى موضوع فردي ، ولكن يجب على أحد الأشخاص دائمًا أن يعطي 100٪ من المعلومات التي تم جمعها إلى 1٪ إضافية من تحقيق الهدف.
يتم عرض جميع حالات الاتصال "اللفظي" و "غير اللفظي" للبوتات أثناء دراسة موردخ في الفيديو:
مصفوفة من صنع الإنسان وغير واضحة نتيجة لاتصالات الروبوت
الفكرة الرئيسية لمردخ هي التأكد من أن فهم "العالم المحيط" ، فإن البوتات تخلق اللغة اللازمة لهذا الفهم. في مفهومه ، اللغة هي نتيجة الفعل. يلفت علماء آخرون الانتباه إلى حقيقة أن اللغة المتطورة والقدرة على التواصل في الموضوعات المجردة ستسمح للآلات بإنشاء أفكارهم الخاصة ووصف وإنشاء كيانات جديدة لم تكن موجودة من قبل. ليس هناك بعيد عن التحول في عالمنا.
تعتبر القدرة على فهم اللغة الطبيعية مرتبطة ارتباطًا وثيقًا بوجود الوعي في موضوع الاتصال. هل ستؤدي القدرة على فهم معنى ما قيل إلى ظهور الوعي في الآلات؟ ربما فقط الشخص الذي لديه إبداع يشبه الإنسان يمكنه فهم اللغة الطبيعية تمامًا ، وسوف يؤدي إنشاء لغة روبوت في بيئتهم الخاصة إلى روبوتات ذكية في هذا الإصدار أو ذاك من Agent Smith.
يتعارض تحديد أولويات الروبوتات أثناء التدريب مع المبدأ الهندسي للموثوقية والقدرة على التنبؤ بتشغيل الماكينة. إن عدم القدرة على التنبؤ بالأولويات ، والقدرة على التخيل ، والتعليم الذاتي ، وسرية التواصل بين الروبوتات للبشر - قد جعلوا أنفسهم يشعرون به بالفعل في
تجارب OpenAI السابقة. بدون هدف نهائي ملزم ، جاءت البرامج بأولويات غير متوقعة خلال فترة دراستها. في التجربة على سباقات القوارب الافتراضية ، أصبح تنفيذ المهام ذات الصلة للبوتات أكثر ربحية من مكان واحد وإكمال السباق بشكل عام حتى النهاية. جلب إنجاز المهام المرتبطة 20 ٪ نقاط أكثر.
إنه مألوف ، أليس كذلك؟ وصف روبرت سيكلي هذا قبل 65 عامًا في القصة الشهيرة "Guardian Bird" ، التي انتقلت من منع القتل إلى منع أي نشاط على الأرض ، متجاهلة الأولويات والمهام الأخرى للأهم:
تثاءب جاكسون وأوقف السيارة عند الرصيف. لم يلاحظ نقطة فوارة في السماء. لم يكن بحاجة إلى الحذر. في الواقع ، وفقًا لجميع المفاهيم البشرية ، لم يخطط على الإطلاق لعمليات القتل.
أمسك يده ، وأراد إيقاف الإشعال ... وألقى به شيء ما على جدار الكابينة.
قال لطائر ميكانيكي معلقة عليه "أحمق من حديد". السيارة ليست على قيد الحياة. لا أريد قتله على الإطلاق.
لكن الطائر الحارس يعرف شيئًا واحدًا: بعض الإجراءات تتوقف عن نشاط الجسم. السيارة ، بالطبع ، هي كائن نشط ، بعد كل شيء ، فهي مصنوعة من المعدن ، مثل طائر الحارس نفسه ، أليس كذلك؟ وبينما تتحرك ...
فائض إنشاء لغتهم الخاصة في الروبوتات يمكن أن يكون خلقهم للكون الافتراضي الخاص بهم. على الأقل في تاريخ البشرية ، توجد مثل هذه السوابق. على حد تعبير تولكين:
اختراع اللغات هو أساس عملي. تمت كتابة "قصص" أكثر من أجل خلق عالم لهذه اللغات ، وليس العكس. بالنسبة لي ، تظهر الكلمة أولاً ، ثم القصة المرتبطة بها. أفضل كتابة "elven". ولكن ، بالطبع ، خضع كتاب مثل The Lord of the Rings لتحرير جاد ، وتركت هناك العديد من "اللغات" التي يمكن للقارئ استيعابها (على الرغم من أنني الآن اكتشفت أن الكثير يرغب في المزيد). [...] على أي حال ، بالنسبة لي ، من نواح كثيرة ، مقال عن "الجماليات اللغوية" ، حيث أجيب أحيانًا على الأشخاص الذين يسألونني عما كتبت كتابي عنه.
حقيقة أن الآلات ستبدأ في التفكير في وقت أبكر مما نفهم أنه يخشى أيضًا في OpenAI. إذا كان للبوتات أيضًا لغتها الخاصة ، فسيفتقد الناس هذه اللحظة بشكل شبه مؤكد. لذلك ، فإن مهمة موردخ ليست فقط في إنشاء لغة بوت ، ولكن أيضًا في إنشاء مترجم بشري. أولا ، بالطبع باللغة الإنجليزية.
ردا على هذه المخاوف ، يستشهد إيغور بتجربة فكرية معروفة في مجال فلسفة الوعي وفلسفة الذكاء الاصطناعي تسمى
"الغرفة الصينية" ، التي نشرها جون سيرل في عام 1980. جوهر بيان سيرل هو أن أي اتصال كامل ممكن نظريًا تمامًا بدون وعي ، ولكن باستخدام قواعد مفصلة إلى حد ما لتفسير أسئلة المحاور للإجابات. يشير استنتاج سيرل الأعم إلى أن أي تلاعب في التركيبات النحوية لا يمكن أن يؤدي إلى الفهم.
في مثل هذا السياق ، لا تعني لغة المرء وكونه الافتراضي نفسه على الإطلاق وجود الوعي بين وكلاءه وأشياءه. كما هو الحال في ألعاب الكمبيوتر. أو ، كما يعتقد البعض ، كشخص ليس وعيه سوى بوابة دلالية بين لغة "اصطناعية" واضحة داخل الدماغ والضوضاء الطبيعية للإشارات من العالم الخارجي.