الفيسبوك يجعل المحادثة واجهة شعبية المقبل

في حين أن الروبوتات غير قادرة على التحدث مثلما يفعل البشر. لكن الباحثين على موقع Facebook AI يقومون بالفعل بالفعل باختراق هذه المنطقة ؛ هذا يمكن أن يؤثر بشكل خطير على رسل الشركة ، وليس فقط




كان Chatbots موضوعًا شائعًا للغاية في عام 2015. كان M من Facebook الأكثر شهرة ، والذي كان من المفترض ، وفقًا لخطط الشركة ، أن يصبح روبوتًا مرنًا للأغراض العامة ، قادر على الكثير من الأشياء - طلب البضائع ، وتقديم الهدايا ، وحجز الطاولات في المطعم والتخطيط للسفر. ومع ذلك ، فإن الضجيج كان عاليا جدا للنتيجة. عندما اختبر Facebook موقع M الخاص به لـ 2500 شخص من منطقة خليج سان فرانسيسكو ، لم يتعامل البرنامج مع معظم المهام الموكلة إليه.

بعد أول موجة من الحماس تجاه M وغيرها من مواقع الدردشة (صرح مدير شركة Microsoft Satya Nadella عمومًا أن "chatbots هي تطبيقات جديدة") ، تبعتها موجة من خيبات الأمل . تجاذب أطراف الحديث ثرثرة ، وانجذبت نحو الروبوتات. هذا لأنه تم تعليمهم التحدث عن مواضيع ضيقة للغاية وأداء مهام محددة للغاية. لم يتمكنوا من الحفاظ على محادثة طبيعية مع الناس ، لإعطاء إجابات تستند إلى فهم الكلمات ومعناها. يمكنهم فقط إصدار ملاحظات عامة.

حتى قبل دخول M مرحلة الاختبار التجريبي ، خفض Facebook من خططه الفائقة لهذا الروبوت ، على الرغم من أن تكنولوجيا اللغة الطبيعية جزئيًا سقطت في مجموعات دردشة Messenger Messenger الأقل طموحًا ، القادرة على أداء مهام فردية بسيطة مثل طلب الطعام أو إعطاء إجابة من القائمة أسئلة وأجوبة. لا تزال شركات مثل American Express و 1-800-FLOWERS تستخدم مواقع الدردشة البسيطة المشابهة للإجابة على أسئلة المستخدم لدعم وقبول الطلبات البسيطة وإصدار معلومات حول رصيد حسابها الشخصي. سيظل الكثيرون يغيرونك إلى شخص إذا طرحت سؤالًا خارج نطاق اختصاصه المحدود.

ومع ذلك ، فقد تقدم فريق البحث AI AI بالفعل بمشاريع مثل chatbots البسيطة. أخبرني أنطوان بوردي ، باحث لغة طبيعي من فيسبوك ، "على مدى السنوات الثلاث إلى الأربع الماضية ، كنا نقول إننا لن نسير على طريق دراسة الحوارات الهادفة إلى تحقيق هدف معين - هذه مهمة صعبة للغاية تنطوي على مخاطر كبيرة للغاية". إذا كان chatbot السفر "يحجز الطائرة الخطأ ، والرحلة الخطأ ، سيكون خطأ كبير للغاية من حيث المال ، والسفر ، وما إلى ذلك ،" يقول.

وبدلاً من التركيز على آليات بعض المهام ، يقول بوردي ، فإن Facebook يخطو خطوة إلى مهمة أعمق - لتدريب الوكلاء الظاهريين على التواصل مثل الأشخاص. إذا تمكنت chatbots من فهم الأشخاص والتحدث معهم بشكل أفضل ، فعندئذ ، كما تصورت الشركة ، سيصبحون في النهاية أفضل المساعدين الذين يمكنهم مساعدة الأشخاص على أداء المهام العملية ، مثل حجز جميع التذاكر نفسها.

فيسبوك يستثمر بنشاط في هذه التطورات ، وتوظيف أفضل خبراء اللغة الطبيعية لمنظمة العفو الدولية. تحب الشركة أن تشير إلى أنها ، على عكس عمالقة التكنولوجيا الآخرين ، فإنها تتيح نتائج أبحاث الذكاء الاصطناعى المتاحة على الإنترنت لمجتمع البحث بأكمله ، على أمل أن تساعد الآخرين على إنشاء جيل جديد من الذكاء الاصطناعي. لكن هذا البحث ، بطبيعة الحال ، سوف يدخل في منتجاتهم الخاصة.

يبدو المرسلون ، مثل Messenger و WhatsApp (لا يزال Facebook لا يفهم كيفية تسييل هذا الأخير) مجالًا طبيعيًا لتطبيق هذه التطورات. يتحدث زوكربيرج عن أفكار الشركة للتركيز على الاتصالات الخاصة ، لذلك سيتعين على Messenger و WhatsApp إضافة ميزات جديدة حتى لا يمنحا المنصات الأخرى المماثلة ، ولا سيما WeChat و Telegram و Apple iMessage.

أصبح إنشاء خوارزمية يمكنها دعم إجراء محادثة مجانية مع شخص هدفًا رئيسيًا لشركات التكنولوجيا. تنضم Amazon و Google و Microsoft إلى Facebook في المراهنة على إمكانية التواصل البشري - وليس فقط من خلال الرسائل النصية ، ولكن أيضًا بمساعدة المساعدين الصوتيين ، وبطرق أخرى. بفضل الأبحاث الحديثة ، أصبح الطريق إلى إنشاء جهاز كمبيوتر قادرًا على التواصل بشكل أوضح فجأة - ومع ذلك ، لا تزال ميدالية المركز الأول تنتظر الفائز.

وبعبارة أخرى ، فإن أبحاث اللغة الطبيعية على Facebook تتجاوز مجرد إحياء M أو تحسين الدردشة في برنامج Messenger. إنه متصل بمستقبل الشركة بأكملها.

تقديم الشبكة العصبية


ربما يكون إنشاء وكيل رقمي قادر على إجراء محادثة موثوقة مع شخص هو الأكثر صعوبة في جميع المهام في مجال معالجة اللغة الطبيعية. يجب أن يتعلم الجهاز قاموسًا مليئًا بالكلمات ، مع أمثلة الاستخدام والفروق الدقيقة ، ثم استخدامها في التواصل المباشر مع شخص لا يمكن التنبؤ به.

فقط في السنوات القليلة الماضية ، بدأ مجتمع AI للغات الطبيعية في اتخاذ خطوات كبيرة نحو إنشاء روبوت عام. على وجه الخصوص ، حدث هذا بسبب الاختراقات في مجال الشبكات العصبية - خوارزميات التعلم الآلي التي تتعرف على الأنماط من خلال تحليل كمية هائلة من البيانات.

بالنسبة لمعظم تاريخ الذكاء الاصطناعى ، كان الناس يراقبون البرنامج بينما يتبع عملية التعلم الآلي. في تقنية تسمى "التدريس مع المعلم" ، يقوم الشخص بتدريب شبكة عصبية ببطء ، مع إعطاء الإجابات الصحيحة للمشاكل ، ثم ضبط الخوارزمية بحيث تصل إلى نفس الحل.

يعمل التدريس مع معلم جيدًا إذا كان هناك قدر كبير من البيانات المحددة بدقة - على سبيل المثال ، صور القطط والكلاب أو أشياء أخرى. ومع ذلك ، فإن هذا النهج في كثير من الأحيان لا يعمل في عالم chatbots. من الصعب العثور على عدد كبير (آلاف الساعات) من المحادثات الشخصية المصنّفة ، وسيكون إنشاء مثل هذا الحجم من البيانات من شركة واحدة مكلفًا للغاية.

نظرًا لأنه من الصعب تعليم chatbots التحدث باستخدام الأساليب القديمة ، يبحث الباحثون عن بدائل للتعلم مع المعلم حتى تتمكن الشبكات العصبية من التعلم على أساس البيانات الخاصة بهم ، دون تدخل بشري.

تتمثل إحدى طرق إزالة الحاجة إلى بيانات التدريب في تدريب الآلة بالمعنى العام على المستوى الأساسي. إذا تمكن الكمبيوتر من فهم العالم من حوله - على سبيل المثال ، الحجم النسبي للأشياء ، ثم كيفية استخدام الناس لها ، ومفاهيم معينة حول تأثير قوانين الفيزياء عليها - فمن المحتمل أن يكون قادرًا على تضييق نطاق الخيارات ، مع ترك الخيارات الحقيقية فقط ممكنة.

الناس يفعلون ذلك بطريقة طبيعية. على سبيل المثال ، لنفترض أنك تقود بالقرب من منحدر حاد ، وفجأة تشاهد صخرة كبيرة على الطريق. تحتاج إلى تجنب الاصطدام معه. لكن من خلال اختيار الخيارات ، من غير المحتمل أن تقرر الاتجاه الحاد نحو الهاوية. أنت تعرف أن السيارة ستسقط على الحجارة بسبب الجاذبية.


يان ليكون

وقال جان ليكون ، نائب الرئيس وكبير أخصائي الذكاء الاصطناعى في فيسبوك ، وهو أسطورة لمنظمة العفو الدولية يعمل على أصعب القضايا منذ ثمانينيات القرن الماضي: "الكثير من التعلم الإنساني يتعلق بمراقبة العالم من حولنا". "نتعلم الكثير من الأشياء من الآباء والأشخاص الآخرين ، ولكن فقط من التفاعل مع العالم ، في محاولة لفعل شيء ما ، وفشل وتعديل سلوكنا."

تعمل منظمة العفو الدولية المدربة على استخدام هذه التكنولوجيا التي تسمى "التعلم بدون معلم" بطريقة مماثلة. على سبيل المثال ، تجمع سيارة آلية بيانات حول العالم من خلال العديد من أجهزة الاستشعار والكاميرات ، مثل طفل يدرس العالم بمساعدة خمس حواس. مع هذا النهج ، يوفر العلماء للجهاز كمية كبيرة من بيانات التدريب. لا يطلبون منها إعطاء الإجابة الصحيحة وعدم دفعها إلى هدف محدد. يطلبون منها فقط معالجة البيانات والتعلم منها ، والعثور على الأنماط ، وبناء العلاقات بين النقاط المختلفة في البيانات.

في كثير من الحالات ، من الصعب العثور على البيانات اللازمة. ومع ذلك ، هناك مساحة من الذكاء الاصطناعي يمكن أن تتعلم فيها الشبكة العصبية الكثير عن العالم دون أي مجسات: معالجة اللغة الطبيعية. يمكن للباحثين استخدام الكميات الهائلة من النصوص الموجودة لمساعدة الخوارزميات على فهم العالم البشري ، وهو جزء ضروري من مهمة فهم اللغة.

لنفترض أن الشبكة العصبية تلقت العبارات التالية للتفكير:
لم تتناسب الجائزة مع الحقيبة لأنها كبيرة جدًا.

لم تتناسب الجائزة مع الحقيبة لأنها صغيرة جدًا.


لفهم أنه في كل جملة من الجمل ، تشير كلمة "هو" إلى كائنات مختلفة ، تحتاج النماذج إلى فهم خصائص الكائنات في العالم الحقيقي وعلاقاتها. يقول ليكون: "يحتوي النص الذي تم تدريبهم عليه على بنية كافية لفهم أنه إذا كان لديك كائن يتناسب مع الآخر ، فقد لا يناسب أحدهما الآخر إذا كان كبيرًا جدًا".

هذه التقنية يمكن أن تكون المفتاح لجيل جديد من chatbots الفيسبوك أكثر فائدة واجتماعي.

تلبية بيرت وروبرتا


بدأت الانجازات المستمرة في التعلم بدون معلم لأنظمة معالجة اللغة الطبيعية في Google في عام 2018. ابتكر باحثو الشركة نموذجًا للتعلم العميق BERT (يمثل المحولات ذات الترميز ثنائي الاتجاه) ، وأعطاها نصًا غير مقسوم على 11038 كتابًا و 2.5 مليار كلمة من ويكيبيديا باللغة الإنجليزية. أزال الباحثون عشوائيًا كلمات معينة من النصوص ، واضبطوا النموذج لإدراج كلمة مفقودة.

بعد تحليل النص بأكمله ، وجدت الشبكة العصبية أنماطًا من الكلمات والجمل ، غالبًا ما تظهر في نفس السياق ، مما ساعدها على فهم العلاقات الأساسية بين الكلمات. نظرًا لأن الكلمات تمثل كائنات أو مفاهيم في العالم الحقيقي ، فقد تعلم النموذج أكثر من مجرد العلاقات اللغوية بين الكلمات: فقد بدأ في فهم كيفية ارتباط الكائنات ببعضها البعض.

لم يكن بيرت أول نموذج يستخدم التعلم بدون معلم لفهم اللغة البشرية. لكنها كانت أول من تعلم معنى الكلمة في سياقها.

وقال جيان فنغ جاو ، مدير الأبحاث في مجموعة التعلم العميق ، أحد مختبرات مايكروسوفت للأبحاث: "أود أن أقول إن هذا المشروع هو في الجزء العلوي الأول من الإنجازات التي تحققت في مجال معالجة اللغات الطبيعية". "يستخدم الناس هذا النموذج كمستوى أساسي لإنشاء جميع نماذج معالجة اللغات الطبيعية الأخرى." حتى الآن ، تم الاستشهاد بأبحاث بيرت في أعمال أخرى أكثر من 1000 مرة - يتطور باحثون آخرون على أساسها.

من بينها Lekun مع فريقه. قاموا بإنشاء النسخة الخاصة بهم من هذا النموذج ، نفذت التحسين ، وسعت كمية بيانات التدريب ووقت التدريب. بعد مليارات الحسابات ، أدت شبكة عصبية على Facebook تسمى RoBERTa أداءً أفضل بكثير من Google. أظهرت مستوى دقة 88.5 ٪ ، وبرت - 80.5 ٪ فقط.

يمثل BERT و RoBERTa مقاربة جديدة بشكل جذري لتدريس أجهزة الكمبيوتر للتواصل. يقول ليكون: "في هذه العملية ، يجب أن يشير النظام إلى معنى الكلمات التي يقابلها ، وهيكل الجمل ، والسياق". "في النهاية ، يبدو أنها تدرك معنى اللغة ، وهي غريبة إلى حد ما ، لأنها لا تعرف شيئًا عن الواقع المادي للعالم". ليس لديها رؤية ، ليس لديها سماع ، ليس لديها شيء ". كل ما تعرفه هو اللغة. الحروف والكلمات والجمل.

تقترب من محادثة حقيقية


يقول Lekun أن نموذج اللغة الطبيعية الذي تم تدريبه باستخدام BERT أو RoBERTa لن يطور أي معنى عام ذي معنى - سيكون كافياً فقط تقديم إجابات في الدردشة ، بناءً على قاعدة بيانات شاملة من المعرفة المعممة. هذه مجرد بداية عملية التعلم من الخوارزمية للتحدث مثل الشخص.

يحاول باحثو اللغات الطبيعية على Facebook أيضًا إنشاء مزيد من التفاصيل حول التواصل المستند إلى RoBERTa. لقد بدؤوا بدراسة محادثات الأشخاص الذين يستخدمون chatbots من أجل فهم متى يمكن أن تصبح المحادثة مملة أو تنهار. تساعد اكتشافاتهم في إيجاد طرق لتدريب الروبوت حتى يتمكن من تجنب الأخطاء الأكثر شيوعًا في المحادثة.

على سبيل المثال ، غالبًا ما تتعارض برامج الدردشة مع نفسها لأنهم لا يتذكرون ما قالوه سابقًا. قد يقول chatbot أنها تحب مشاهدة حلقات Knight Rider ، ثم تعلن أنه لا يحب العرض. غالباً ما تجيب Chatbots التي تنشئ إجاباتها الخاصة (بدلاً من استخراج العظة من بيانات التدريب) على أسئلة غامضة حتى لا ترتكب أخطاء. غالبًا ما تبدو غير عاطفية ، لذا فإن التواصل معهم ليس مثيرًا للاهتمام.

يجب أن تكون Chatbots أيضًا قادرة على استخدام المعرفة لجعل التحدث معها مثيرًا للاهتمام. من المرجح أن يكون الروبوت الذي يمكنه استخدام مجموعة واسعة من المعلومات قادرًا على الحفاظ على حوارات طويلة مع الأشخاص. ومع ذلك ، يتم تدريب chatbots الحالية باستخدام المعرفة من منطقة واحدة يتوافق مع المهمة المعينة للروبوت. تصبح هذه مشكلة عندما يبدأ الشخص في قول شيء ما حول مواضيع تتجاوز اختصاص الروبوت. اسأل البيتزا التي تطلب بوت عن أي شيء آخر غير البيتزا ، وسوف تتلاشى المحادثة بسرعة.

للتعامل مع هذا ، يعمل باحثو Facebook على تدريب نماذج معالجة اللغة الطبيعية لاستخراج البيانات من العديد من مجالات المعرفة ، ودمج هذه المعلومات بشكل طبيعي في محادثة. ستركز البحوث المستقبلية على تعليم برامج الروبوت كيف ومتى يتم نقل المحادثة من أشياء عامة إلى مهمة محددة.

أحد أكبر التحديات في تطوير chatbot هو كيفية جعلهم يتعلمون أكثر بعد البدء. يمكن أن يتغير معنى الكلمات بمرور الوقت ، وقد تصبح المصطلحات والمصطلحات الجديدة ذات أهمية ثقافية. في الوقت نفسه ، لا ينبغي أن يكون chatbot قابلاً للإيحاء - تعلم Microsoft tay بوت الكثير من المحادثات عبر الإنترنت بسرعة كبيرة وتحول إلى عنصري وقح خلال 24 ساعة. يقوم Facebook بتدريس برامج الدردشة التجريبية للتعلم من المحادثات الجيدة وتحليل لغة الشخص الذي يتحدثون إليه لمعرفة ما إذا كان الروبوت قد قال شيئًا مملًا أو غبيًا.

من الصعب التكهن بالوقت الذي ستساعد فيه اختراقات Facebook في المختبر على إنشاء روبوتات الدردشة التي يمكنها إجراء محادثات تشبه إلى حد ما المحادثات البشرية. قد لا يمر وقت طويل قبل أن تتمكن من تقييم هذه النتائج بنفسك. قال لي باحث فيسبوك جيسون ويستون: "نعتقد أننا قريبون جدًا من إنشاء روبوت يمكنه التحدث إلى الناس حتى يروا قيمة فيه".

Source: https://habr.com/ru/post/ar470746/


All Articles