
يعد تحديد مستوى الذكاء الاصطناعى من أصعب الأمور ، لكنه أيضًا أحد أهم القضايا في مجال علوم الكمبيوتر. إذا كنت لا تستطيع أن تقول على وجه اليقين ما إذا كان الجهاز الذي تم إنشاؤه اليوم أكثر ذكاءً من الجهاز الذي تم إنشاؤه بالأمس ، فكيف يمكنك تحديد تقدمك؟
للوهلة الأولى ، قد يبدو أن هذه ليست مشكلة على الإطلاق. "بالطبع ، أصبحت الذكاء الاصطناعي أكثر ذكاءً" ، وهو أحد وجهات النظر حول المشكلة. "انظر فقط إلى كل هذه الأموال والأشخاص الموهوبين الذين هرعوا إلى هذه الصناعة. انظر إلى الإنجازات ، مثل إلحاق الهزيمة بالأشخاص في GO ، وجميع أنواع المهام التي لم يكن بالإمكان حلها قبل 10 سنوات ، ولكنها أصبحت اليوم شائعة ، مثل التعرف على الصور. هل هذا حقا لا تقدم؟
رأي آخر هو أن هذه الإنجازات ليست مؤشرا جيدا للذكاء. نعم ، هزيمة الأشخاص في لعبة الشطرنج والذهاب رائعة ، لكن ما أهمية ذلك ، حتى لو خسر أذكى جهاز كمبيوتر عند حل المشكلات العامة للطفل أو الفئران؟
يأتي هذا النقد من باحث الذكاء الاصطناعي فرانسوا شوليه ، وهو مهندس برمجيات من Google وشخصية معروفة في مجتمع تعلم الآلة. Cholet هو منشئ Keras ، وهي مكتبة شائعة جدًا لإنشاء شبكات عصبية. وقد كتب أيضًا العديد من البرامج التعليمية للتعلم الآلي ويحافظ على
حساب Twitter الشهير يعلق على الأحداث الصناعية المختلفة.
في مقال أخير ، "
حول قياس الذكاء "
، يجادل تشوليت أيضًا بأن عالم الذكاء الاصطناعى يجب أن يقرر ما هو الذكاء وما هو غير ذلك. وفقًا لشوليت ، إذا أراد الباحثون إحراز تقدم في إنشاء ذكاء اصطناعي عالمي ، فعليهم التوقف عن النظر إلى المقاييس الشائعة ، مثل ألعاب الفيديو أو ألعاب الطاولة ، ويجب أن تبدأ في التفكير في المهارات التي تجعل الناس أكثر ذكاءً ، مثل قدرتنا على التعميم و التكيف.
في مقابلة مع The Verge التي تمت تقريبًا ، أوضح تشوليه أفكاره حول هذا الموضوع ، موضحًا سبب اعتقاده أن المنجزات الحالية في مجال الذكاء الاصطناعى "مشوهة" ، وكيف يمكننا قياس الذكاء في المستقبل ، ولماذا القصص المخيفة حول الذكاء الاصطناعي الفائق الذكاء ( التي يرويها إيلون موسك وغيرهم) تحتل قدرا كبيرا من الاهتمام بشكل غير معقول في مخيلة الجمهور.
تم تعديل المقابلة قليلاً من أجل الوضوح.
في مقالك ، تصف مفهومين مختلفين للذكاء اللذين أثرا في مجال الذكاء الاصطناعى. يصف الأول الذكاء بأنه القدرة على النجاح في مجموعة واسعة من المهام ، بينما يعطي الثاني الأولوية للتكيف والتعميم ، أي قدرة الذكاء الاصطناعي على الاستجابة للتحديات الجديدة. ما هو المفهوم الأكثر نفوذاً الآن ، وما هي عواقب ذلك؟في السنوات الثلاثين الأولى من تاريخ الصناعة ، كان المفهوم الأول أكثر شعبية: الذكاء كمجموعة من البرامج الثابتة والقواعد المعرفية الصريحة. في الوقت الحالي ، تأرجح البندول بقوة في الاتجاه المعاكس: يتم تمثيل العقل باعتباره "قائمة نظيفة" أو ، إذا تم استخدام استعارة أكثر ملاءمة ، "شبكة عصبية عميقة معدة". لسوء الحظ ، لم يتم التشكيك في هذا المفهوم تقريبًا ولم يتم التحقيق فيه إلى حد كبير. تمت مناقشة هذه القضايا لفترة طويلة في المجتمع العلمي - حرفيًا لعقود - لكن الآن لا أرى وعيًا بين الأشخاص المشاركين في التعلم العميق ، ربما لأن معظمهم جاء إلى هذا المجال بعد عام 2016.
الاحتكارات الفكرية من وجهة نظر واحدة فقط ليست جيدة أبدًا ، لا سيما كإجابة على الأسئلة العلمية غير المفهومة جيدًا. هذا يحد من مجموعة من الأسئلة المطروحة. إنه يحد من عدد الأفكار التي قد يطرحها الناس. أعتقد أن الباحثين أصبحوا الآن يدركون هذه الحقيقة.
في مقالتك ، تجادل أيضًا بأن تحسين الذكاء الاصطناعي يتطلب تعريفًا أكثر دقة للذكاء. تدعي أن الباحثين يركزون الآن على المعايير والاختبارات الإحصائية ، مثل الفوز بألعاب الفيديو وألعاب الطاولة. لماذا تفتقد هذا الذكاء؟الحقيقة هي أن اختيار مثل هذا التدبير ، سوف تستخدم جميع الثغرات المتاحة (الاختصارات ، المسارات المختصرة) لتحقيق ذلك. على سبيل المثال ، إذا اخترت لعبة الشطرنج كمقياس للذكاء (كان هذا من سبعينيات القرن العشرين وحتى التسعينيات) ، فسينتهي بك الأمر إلى لعب لعبة الشطرنج ولا شيء آخر. لا يوجد سبب للاعتقاد بأن هذا النظام سيكون جيدًا لأي شيء آخر. نتيجة لذلك ، يمكنك الحصول على شجرة بحث و minimax ، فإنه لا يقول أي شيء عن الذكاء البشري. اليوم ، يندرج السعي وراء إتقان ألعاب الفيديو مثل Dota أو StarCraft في المصيدة الفكرية نفسها.
ربما هذا غير واضح ، لأنه في البشر ، ترتبط المهارات والذكاء ارتباطًا وثيقًا. يمكن للعقل البشري استخدام ذكائه العالمي لإتقان مهارات خاصة لهذه المهمة. يمكن اعتبار الأشخاص الذين يتقنون الشطرنج حقًا أذكياء جدًا ، لأننا نعرف بشكل غير مباشر أنهم بدأوا من نقطة الصفر وكان عليهم استخدام ذكائهم العالمي لتعلم كيفية لعب الشطرنج. لم تكن مصنوعة للعب الشطرنج. لذلك ، نحن نعرف أنه يمكنهم توجيه ذكائهم العالمي إلى مهام أخرى وتعلم كيفية أداء هذه المهام بطريقة مماثلة. هذا هو ما براعة.
ولكن مع السيارات بشكل مختلف قليلا. يمكن تصميم آلة للعب الشطرنج. وبالتالي ، فإن النتيجة التي توصلنا إليها حول الناس - "يمكن أن يلعبوا لعبة الشطرنج ، وبالتالي ، يجب أن يكونوا أذكياء" - تنهار. وافتراضات مجسم لدينا لم يعد من الممكن تطبيقها. يمكن أن يتقن الذكاء العالمي المهارات الخاصة بالمهمة ، لكن لا يوجد تحول من المهارات الخاصة بالمهام إلى الذكاء العالمي. تماما. وهكذا ، في السيارات والمهارات والذكاء هما شيئان مختلفان تماما. يمكنك تحقيق مهارات تعسفية في المهام التعسفية إذا كان يمكنك جمع كمية لا حصر لها من البيانات حول مهمة (أو إنفاق كمية لا حصر لها من الموارد الهندسية). وما زال لا يجعلك أقرب إلى الذكاء الشامل.
النقطة الأساسية هنا هي أنه لا توجد مشكلة في أن تحقيق مهارة عالية سيكون علامة على الذكاء. فقط إذا كانت المهمة ليست مهمة ميتا ، وحلها سيكون من الضروري اكتساب مهارات جديدة في مجموعة واسعة من المشاكل التي لم تكن معروفة من قبل. هكذا أقترح قياس الذكاء.
إذا كانت الاختبارات الحالية لا تساعدنا على تطوير الذكاء الاصطناعي بذكاء أكثر مرونة ومرونة ، فلماذا تحظى بشعبية كبيرة؟ليس هناك شك في أن الجهود المبذولة لهزيمة البطل في ألعاب الفيديو الشهيرة ترجع في المقام الأول إلى حقيقة أن مثل هذه المشاريع يمكن أن تجذب الكثير من اهتمام وسائل الإعلام. إذا لم يكن الجمهور مهتمًا بهذه "الإنجازات" المذهلة ، والتي يمكن تخيلها بسهولة على أنها تقدم مفترض في تحقيق الذكاء الاصطناعي الخارق ، فإن الباحثين سيفعلون شيئًا آخر.
هذا يجعلني حزين بعض الشيء ، لأن البحث يجب أن يجيب على الأسئلة العلمية المفتوحة ، وليس الانخراط في العلاقات العامة. إذا كنت تنوي "حل" Warcraft 3 على مستوى فوق طاقة البشر ، باستخدام تدريب عميق ، فيمكنك أن تكون متأكدًا تمامًا من أن كل شيء سينجح شريطة أن تكون لدينا موهبة للتنمية وقوة حوسبة كافية (والتي ستتكلف عشرات الملايين من الدولارات لحل هذه المشكلة). ولكن بعد القيام بذلك ، ماذا أتعلم عن الذكاء أو التنوع؟ لا تهتم. في أفضل سيناريو ، سأكتسب المعرفة الهندسية لتوسيع نطاق التعلم العميق. لذلك ، أنا لا أعتبر هذه دراسة علمية ، لأنها لا تعلم ما لم نعرفه بعد. نحن لا نجيب على سؤال واحد مفتوح العضوية. إذا كان السؤال: "هل يمكن أن نلعب X على مستوى فائق عن الإنسانية؟" ، فإن الإجابة لا لبس فيها: "نعم ، إذا كان بإمكانك توليد الكثير من المواقف التدريبية وتمثيلها في نموذج تعليمي معبر إلى حد ما". لقد عرفنا هذا منذ بعض الوقت. (في
الواقع ، قلت هذا قبل وصول مستوى الذكاء الاصطناعي إلى مستوى البطل في دوتا 2 وستاركرافت. )
ما هي برأيك الإنجازات الحقيقية لهذه المشاريع؟ إلى أي مدى يتم تفسير نتائجهم أو تشويهها؟أحد التشويهات الخطيرة التي أراها هو أن أنظمة الألعاب عالية المستوى هذه تمثل تقدمًا حقيقيًا نحو "أنظمة الذكاء الاصطناعي وقدرتها على التعامل مع تعقيد العالم الواقعي وعدم اليقين" [هذا من بيان OpenAI في بيان
صحفي إلى OpenAI Five بوت لعب دوتا 2]. لكنهم لا يستطيعون. إذا كان الأمر كذلك ، فستكون هذه دراسات مفيدة للغاية ، لكن هذا ببساطة غير صحيح. على سبيل المثال ، خذ OpenAI Five: لم يستطع تحمل تعقيد Dota 2 ، لأنه تم تدريبه على 16 حرفًا ، ولم يتمكن من نشر المعرفة على اللعبة بأكملها ، حيث يوجد أكثر من 100 حرف. استغرق الأمر 45000 سنة من اللعب لتدريبه - مرة أخرى ، لاحظ كيف تنمو متطلبات بيانات التدريب إلى جانب تعقيد المهمة - ومع ذلك ، فقد تبين أن النموذج الناتج هش للغاية: يمكن للاعبين من غير الأبطال إيجاد استراتيجيات لهزيمة الروبوت من خلال بعد أيام قليلة أصبحت منظمة العفو الدولية متاحة للجمهور.
إذا أردت يومًا أن تتعلم كيف تتعامل مع تعقيد العالم الحقيقي وعدم اليقين ، فعليك أن تبدأ بطرح أسئلة مثل: ما هي عالمية الذكاء؟ كيف نقيس ونزيد من التنوع في أنظمتنا التعليمية؟ وهذا لا يختلف تمامًا عن ما نقوم به الآن ، عندما نسقط 10 أضعاف البيانات في شبكة عصبية كبيرة بحيث تعمل على تحسين مهاراتها بنسبة عدة بالمائة.
إذن ، ما هو مقياس الذكاء الأفضل للصناعة؟باختصار ، يجب أن نتوقف عن تقييم المهارات في المهام المعروفة مسبقًا مثل لعبة الشطرنج أو Dota أو StarCraft ، وبدلاً من ذلك نبدأ في تقييم قدرة النظام على اكتساب المهارات. هذا يعني أنه يجب علينا استخدام المهام الجديدة التي لم تكن معروفة من قبل للنظام ، وقياس المعرفة الأولية بالمهمة التي بدأ بها النظام ، وقياس فعالية النظام (مقدار البيانات اللازمة لمعرفة كيفية إكمال المهمة). كلما قلت المعلومات (المعرفة والخبرة السابقة) التي تحتاجها لتحقيق مستوى معين من المهارات ، كنت أكثر ذكاءً. بالنظر إلى ما سبق ، في الواقع ، ليست الأنظمة الحديثة للذكاء الاصطناعي ذكية للغاية.
بالإضافة إلى ذلك ، مع هذا المقياس من الذكاء ، ستبدو الآلات أكثر شبهاً بالناس لأن هناك أنواعًا مختلفة من الذكاء ، والذكاء البشري هو ما نعنيه بشكل غير مباشر عندما نتحدث عن الذكاء العالمي. وهذا يشمل أيضًا محاولات لفهم مجموعة المعارف التي يولدها الناس في العالم. يتعلم الناس بشكل لا يصدق - يحتاجون إلى خبرة قليلة للغاية لاكتساب مهارات جديدة - لكنهم لا يفعلون ذلك من نقطة الصفر. يستخدمون المعرفة الفطرية ، بالإضافة إلى المهارات والمعارف المتراكمة طوال الحياة.
في مقالتي الأخيرة ، أقترح مجموعة بيانات تقييم جديدة ، ARC ، تشبه إلى حد بعيد اختبار الذكاء. ARC عبارة عن مجموعة من المهام العقلية التي يتم فيها شرح كل مهمة في سلسلة قصيرة من العروض التوضيحية ، عادةً ثلاثة ، ويجب أن تتعلم كيفية إكمال المهمة من هذه العروض التجريبية القليلة. الفكرة وراء ARC هي أن كل مهمة تقوم بتقييم نظامك يجب أن تكون جديدة تمامًا وأن تشمل فقط المعرفة التي تتوافق مع المعرفة الفطرية للإنسان. على سبيل المثال ، لا يمكن استخدام اللغة البشرية في هذه المهام. حاليًا ، يمكن للناس حل ARC دون أي تفسير شفهي أو تحضير أولي ، ولكن لا يمكن لأي من أنظمة الذكاء الاصطناعي المعروفة حاليًا حلها. هذه علامة مهمة نحتاج إلى أفكار جديدة.
هل تعتقد أن عالم الذكاء الاصطناعى سوف يكون قادرًا على مواصلة تقدمه ببساطة عن طريق زيادة القوة الحاسوبية لحل المشكلات؟ يجادل البعض أنه على مر السنين ، كانت هذه هي الطريقة الأكثر فعالية لزيادة الإنتاجية. عندما يشير آخرون إلى أننا إذا اتبعنا هذا المسار ، فإن النتائج ومعدلات النمو ستبدأ في التدهور.هذا صحيح تمامًا إذا كنت تعمل في مهمة محددة. سيؤدي استخدام المزيد من بيانات التدريب والمزيد من القدرة الحاسوبية لمهمة عمودية إلى زيادة إنتاجية هذه المهمة. لكنه سوف يعطيك فهمًا عمليًا تقريبًا عن كيفية تحقيق التنوع في الذكاء الاصطناعي.
إذا كان لديك نموذج كبير بما فيه الكفاية من التدريب المتعمق وعينة جيدة لهذه المهمة ، فسوف تتعلم كيفية حل هذه المشكلة ، سواء كانت Dota أو StarCraft ، أي شيء. وهي قيمة للغاية. يمكن استخدام هذا في عدد لا حصر له تقريبا من المهام المتعلقة بتصور الجهاز. المشكلة الوحيدة هي أن كمية البيانات التي تحتاجها هي وظيفة توافقية بالنسبة لتعقيد المهمة ، لذلك حتى المهام المعقدة قليلاً يمكن أن تصبح باهظة الثمن.
خذ على سبيل المثال السيارات الطيار الآلي. لن تكون ملايين المواقف التدريبية كافية لنموذج يستخدم التدريب المتعمق فقط لمعرفة كيفية القيادة بأمان. هذا هو السبب في أننا لا نملك بعد الطيار الآلي المستوى الخامس. وفي أنظمة الطيار الآلي الأكثر تقدما ، يستخدم التعلم العميق أساسا لربط بيانات الاستشعار والنماذج التي تم إنشاؤها يدويا. وإذا كان لدينا تعلم عميق عميق ، فسيكون لدينا الطيار الآلي المستوى 5 في عام 2016 في شكل شبكة عصبية واحدة كبيرة.
أخيرًا ، نظرًا لأنك تتحدث عن قيود الذكاء الاصطناعي الحديث ، يبدو لي جديراً أن أسأل عن الخوف من أن منظمة العفو الدولية القوية للغاية يمكن أن تلحق الضرر بالبشرية في المستقبل القريب. هل تعتقد أن هذه مخاوف راسخة؟لا ، أنا لا أؤمن بصحة هذه الفكرة. لم نقم أبدًا بإنشاء منظمة العفو الدولية المستقلة. ولا توجد أية علامات تدل على أننا سنكون قادرين على إنشائه في المستقبل المنظور. (صناعة الذكاء الاصطناعى لا تتحرك في هذا الاتجاه الآن). ولا يمكننا حتى أن نتخيل ما هي خصائصها إذا أنشأناها في النهاية في المستقبل البعيد. إذا كنت ترغب في الحصول على تشبيه ، فهذا يشبه السؤال في عام 1600: "المقذوفات تتطور بسرعة كبيرة! ولكن ماذا لو كان لدينا سلاح يمكنه تدمير مدينة بأكملها. كيف يمكننا التأكد من أنها ستقتل الأشرار فقط؟ " هذا سؤال ضعيف إلى حد ما ، ومناقشته في غياب أي معرفة دقيقة حول الذكاء الاصطناعى المستقبلي ، في أحسن الأحوال تأتي في حجة فلسفية.
ومع ذلك ، فإن هذه المخاوف بشأن الذكاء تصرف الانتباه عن المجالات الأخرى التي يمكن أن تكون فيها الذكاء الاصطناعي خطيرة للغاية اليوم. هناك طرق معينة لاستخدام الذكاء الاصطناعي تشكل خطورة من دون ذكاء فائق. كتبت عن كيف يمكن استخدام الذكاء الاصطناعي لأنظمة الدعاية الخوارزمية. لقد كتب الكثير بالفعل عن الاتجاه المتزايد لاستخدام الذكاء الاصطناعي في أنظمة الأسلحة أو حول الذكاء الاصطناعي كأداة للسيطرة الاستبدادية.
هناك قصة حول حصار القسطنطينية عام 1453. بينما كانت المدينة تقاتل الجيش العثماني ، ناقش علماءها وحكامها نوع الملائكة من الجنس. وكلما كرسنا مزيدًا من الطاقة والاهتمام للحوار حول جنس الملائكة أو التفكير في تلك القيم التي ينبغي أن يتمتع بها الذكاء الاصطناعي الفائق الذكاء ، قل اهتمامنا بحل المشكلات الملحة والحقيقية. هناك زعيم واحد معروف في مجال تكنولوجيا المعلومات يحب التحدث عن الذكاء الاصطناعي الفائق باعتباره التهديد الرئيسي للإنسانية. حسنًا ، بينما تحتل هذه الأفكار جميع العناوين الرئيسية ، إلا أنك لا تناقش ما إذا كان من المنطقي إنتاج سيارات ذات طيار آلي غير دقيق بدرجة كافية على طرقاتنا ، مما يؤدي إلى وقوع حوادث ووفيات.
إذا قبلت هذا النقد - أنه في الوقت الحالي لا يوجد أساس فني لهذه المخاوف - لماذا ، في رأيك ، ما هي شعبية كبيرة؟أعتقد أن هذه مجرد قصة جميلة ، والناس يحبونها. ليس من قبيل الصدفة أن يذكّر كل شيء المرء بالكثير من القصص الدينية عن نهاية العالم ، لأن هذه القصص انتشرت وتردد صداها بين الناس لفترة طويلة. للسبب نفسه ، غالبًا ما يستخدم هذا الخوف في أفلام وروايات الخيال العلمي. ذلك لأنها قصة جميلة. ويحتاج الناس إلى قصص لفهم العالم. وهذه القصص مطلوبة أكثر بكثير من فهم طبيعة الذكاء أو فهم ما يدفع التقدم التكنولوجي.
هناك أيضًا قطع أكثر إثارة
في قناة Telegram .