المشكلة الأكبر في الذكاء الاصطناعى ليست أنها غبية ولكن عدم وجود تعريف للذكاء ، وبالتالي عدم وجود مقياس لذلك [1 أ] [1 ب] .
اختبار تورينج ليس إجراءً جيدًا لأن الغوريلا كوكو لن تمر على الرغم من أنها يمكن أن تحل مشاكل أكثر من العديد من البشر المعوقين [2] .
من الممكن تمامًا أن يتساءل الأشخاص في المستقبل عن سبب اعتقاد الناس في عام 2019 أن الوكيل الذي تدرب على لعب لعبة ثابتة في بيئة محاكاة مثل Go كان لديه أي معلومات استخبارية [3a] [3b] [3c] [3] [3e] ] [3f] [3g] [3h] .
الذكاء هو أكثر من تطبيق / نقل المعرفة القديمة إلى مهام جديدة (لعب Quake Arena جيد بما يكفي دون أي تدريب بعد إتقان Doom) من ضغط خبرة الوكيل في الاستدلال للتنبؤ بنتيجة اللعبة وتحديد تصرف الوكيل في حالة لعبة معينة لزيادة النتيجة النهائية ( لعب Quake Arena جيد بما فيه الكفاية بعد مليون لعبة بعد إتقانه Doom) [4] .
الذكاء البشري يدور حول القدرة على التكيف مع العالم المادي / الاجتماعي ، ولعب Go هو تكيف معين يؤديه الذكاء البشري ، وتطوير خوارزمية لتعلم العزف على Go هو أكثر أداء ، وقد يكون تطوير نظرية رياضية لـ Go أكثر أداء.
من المنطقي أن تقارن الذكاء الاصطناعي مع البشر ليس بفعالية وكفاءة المنتجات النهائية للتكيف (في الألعاب التي تلعبها الذكاء الاصطناعي والإنسان) ولكن بفعالية وكفاءة عملية التكيف (في الألعاب التي يتم لعبها بين وكيل تعلّمه الآلة و عامل مشفر بواسطة الإنسان بعد ممارسة محدودة) [5] .
قد يتم حل Dota 2 و StarCraft 2 و Civilization 5 وربما حتى GTA 5 في المستقبل غير البعيد ، لكن القدرة على لعب أي لعبة جديدة على المستوى البشري دون تدريب مسبق ستكون أكثر أهمية.
ثاني أكبر مشكلة في الذكاء الاصطناعي هي الافتقار إلى المتانة في ذيل طويل من المواقف غير المسبوقة (بما في ذلك الحالات الحرجة في الرعاية الصحية [6 أ] ، والمركبات ذاتية القيادة ، والتمويل) والتي لا يمكن معالجتها في الوقت الحالي بدقة حتى بالقرب من المقبول [6 ب] ] [6c] [6d] [6e] [6f] .
تستغل النماذج المعقدة أي أنماط تربط المدخلات بمتغيرات الإخراج ، لكن قد لا يتم الاحتفاظ ببعض الأنماط للحالات التي تغطيها بيانات التدريب بشكل سيئ [المقطع "تقدم"] [7 أ] [7 ب] [7 ج] . يستخدم 99٪ من تطبيقات الرعاية الصحية نماذج بسيطة مثل الانحدار اللوجستي (يتم تحويل معرفة المجال إلى رمز لحساب الإحصائيات كمزايا) وذلك لتجنب الارتباطات الزائفة واكتساب المزيد من المتانة في القيم المتطرفة [8 أ] [8 ب] .
بالنسبة للعامل في بيئة محاكاة مثل Go أو Quake ، فإن النموذج الصحيح للبيئة إما معروف أو متوفر حتى يتمكن هذا الوكيل من توليد أي قدر من بيانات التدريب من أجل معرفة كيفية التصرف على النحو الأمثل في أي موقف. اكتشاف الارتباطات في تلك البيانات ليس ذكيًا - للمشاكل الواقعية اكتشاف النموذج الحقيقي هو المفتاح [9a] [9b] [9c] [9d] [9e] .
بالنسبة للكائن الحي ، فإن العالم الحقيقي ليس لعبة ثابتة ذات بيئة وقواعد معروفة مثل Go أو Quake ، ولكنها لعبة ذات بيئة وقواعد غير معروفة إلى حد كبير وتتغير دائمًا [10] . يجب أن تتكيف مع التغييرات غير المتوقعة للبيئة والقواعد بما في ذلك التغييرات التي تسببها الخصوم. يجب أن تكون قادرة على الاستقلالية على نطاق واسع بدلاً من مجرد التشغيل الآلي الضروري للعب لعبة ثابتة.
قد يكون من المستحيل امتلاك مركبات ذاتية القيادة وروبوتات تعمل بالأنسويد تعمل جنباً إلى جنب مع البشر دون تدريبهم على الحصول على القدرة على التكيف على مستوى العالم الواقعي. قد يكون من المستحيل وجود مساعدين شخصيين يقومون باستبدال البشر في الجوانب الرئيسية من حياتهم دون تدريبهم على الحصول على قدرة الإنسان على التكيف مع العالم الاجتماعي [11 أ] [11 ب] [ 11 ج ] .
المعرفة مقابل الذكاء
المعرفة هي بعض المعلومات ، مثل البيانات المستمدة من الملاحظات أو التجارب ، مضغوطة وممثلة في بعض الأشكال الحسابية ، مثل النص في اللغة الطبيعية ، والنظرية الرياضية في اللغة شبه الرسمية ، أو البرنامج بلغة رسمية ، أو أوزان الشبكة العصبية الاصطناعية أو نقاط ربط الدماغ. .
المعرفة حول الأدوات (النظرية ، البرنامج ، العملية المادية) لحل المشاكل. الذكاء يدور حول تطبيق (نقل) وخلق (التعلم) المعرفة [12] . هناك معرفة كيفية حل المشكلة (برنامج للكمبيوتر ، كتاب مدرسي للبشر) ، ثم هناك عملية لتطبيق المعرفة (تنفيذ البرنامج عن طريق الكمبيوتر ، استنتاج وتنفيذ تعليمات من قبل البشر) ، ثم هناك عملية خلق المعرفة (الاستدلال الاستقرائي / التعلم من الملاحظات والتجارب ، التفكير الاستنتاجي من النظريات المستخلصة والنماذج المستفادة - إما عن طريق أجهزة الكمبيوتر أو البشر).
إن Alpha (Go) Zero أقرب إلى معرفة كيفية حل فئة معينة من المشكلات مقارنةً بعامل ذكي قادر على تطبيق المعرفة وخلقها. إنها خوارزمية بحث مثل IBM Deep Blue مع عدم وجود استدلال على الاستدلال ولكن يتم ضبطها أثناء جلسات اللعبة. لا يمكن تطبيق المعرفة المكتسبة على مشاكل أخرى - حتى اللعب على لوحة Go أصغر. لا يمكن إنشاء معرفة مجردة مفيدة للبشر - حتى نظرة بسيطة على تكتيكات الذهاب. على الرغم من أنه قد يثير بعض البصيرة المفيدة في الإنسان إذا لعب مع تكتيكات غير عادية.
يعتبر TD-Gammon من عام 1992 من قبل الكثيرين أكبر طفرة في الذكاء الاصطناعي [13 أ] [13 ب] . يستخدم TD-Gammon خوارزمية TD (with) مع تحديثات السياسة عبر الإنترنت. استخدم مؤلف TD-Gammon تنوعه لمعرفة استراتيجية الرهان في IBM Watson [13c] . Alpha (Go) Zero هو أيضًا تقريبًا تباين في TD (λ) [13d] . استخدمت TD-Gammon شبكة عصبية تم تدريبها عن طريق تعلم الفرق الزمني مع القيم المستهدفة المحسوبة باستخدام البحث الشجري بعمق لا يزيد عن ثلاثة واستخدام نتائج الألعاب التي لعبت حتى النهاية كتقدير لقيم الأوراق. يستخدم Alpha (Go) Zero شبكة عصبية عميقة يتم تدريبها بواسطة Temporal Difference مع القيم المستهدفة المحسوبة باستخدام بحث Monte-Carlo Tree مع عمق أكبر بكثير واستخدام تقديرات القيم الورقية وإجراءات السياسة المحسوبة بواسطة الشبكة دون ممارسة الألعاب حتى النهاية.
الاختلافات النوعية بين لعبة الطاولة و Go كمشكلات وبين TD-Gammon و Alpha (Go) Zero كحلول (نطاق الشبكة العصبية وعدد الألعاب التي تم لعبها اختلافات رئيسية) ليست بنفس حجم الاختلافات النوعية بين ألعاب المعلومات المثالية مثل Go وألعاب معلومات غير كاملة مثل Poker (لا يكون تطبيق AlphaZero قابلاً للتطبيق على Poker ، و DeepStack لا ينطبق على Go و Chess).
ليس IBM Watson ، وهو نظام الرد على الأسئلة الأكثر تقدمًا حتى الآن في عام 2011 ، عميلًا ذكيًا. إنها معرفة ممثلة كآلاف الأسطر من المنطق المشفر يدويًا للبحث عن تسلسل الكلمات ومعالجتها وكذلك توليد الفرضيات وجمع الأدلة ، بالإضافة إلى بضع مئات من المعلمات التي يتم ضبطها مع الانحدار الخطي لوزن في أجزاء مختلفة من المعرفة لكل نوع من أنواع الأسئلة المدعومة و الإجابة [14a] [14b] [14c] . لا يختلف هذا الأمر كثيرًا من الناحية النظرية عن محركات قاعدة البيانات التي تستخدم إحصائيات البيانات وقيم العتبة المضغوطة لإنشاء خطة لتنفيذ استعلام معطى عن طريق تحديد مجموعة فرعية من الخوارزميات المنفذة لمعالجة البيانات.
يمكن لـ IBM Watson تطبيق منطقه لاستخراج المعلومات النصية وتكاملها (المعرفة الداخلية) على النصوص الجديدة (المعرفة الخارجية). ومع ذلك ، لا يمكن تطبيق معرفتها على مشاكل بخلاف الإجابة على الأسئلة الواقعية دون أن يتم ترميزها من قبل البشر. يمكن ترميزه للبحث عن أدلة تدعم الفرضيات في الأوراق الخاصة بالسرطان ولكن فقط باستخدام المنطق البشري المشفر لتفسير النصوص (استخراج ومطابقة الكلمات ذات الصلة) وعدم تجاوز ذلك لتفسير النصوص من تلقاء نفسها (نموذج التعلم في العالم و تعيين النصوص إلى عمليات المحاكاة على هذا النموذج). النهج السابق لتفسير النصوص كان كافيا لخطر! [15] لكن هذا لا يكفي تقريبًا عندما لا توجد إجابة بسيطة واحدة. هناك فرق كبير بين إجراء استنتاجات باستخدام الخصائص الإحصائية للنصوص واستخدام الخصائص الإحصائية لظواهر العالم الحقيقي المقدرة بمحاكاة للنموذج المستعلم لتلك الظواهر.
لا يمكن لـ IBM Watson إنشاء معرفة جديدة - يمكنه استنتاج حقائق بسيطة من مصادر المعرفة (النصوص وقواعد المعرفة) باستخدام خوارزميات مرمزة من قِبل الإنسان ، لكنه لا يستطيع حث النظرية من المصادر والتحقق من حقيقتها. يفترض WatsonPaths رسمًا بيانيًا باستخدام البحث عن النصوص ذات الصلة بالحالة [16 أ] [16 ب] ولكن استنباط التسلسل كنهج في التفكير لا يمكن أن يكون قويًا بما فيه الكفاية - يجب التحقق من الاستدلالات بالمحاكاة أو التجارب كما يفعل المخ.
ما هو الذكاء؟
يعرّف البيولوجيون الذكاء بأنه القدرة على إيجاد حلول غير قياسية للمشاكل غير القياسية (بمعنى آخر ، القدرة على التعامل مع المجهول ، على عكس المعروف والمجهول المعروف) وتمييز هذه الصفة عن ردود الفعل / الغرائز المحددة كحلول قياسية للمشاكل القياسية [17 أ] [17 ب] . لا يمكن اعتبار Play Go مشكلة غير قياسية لـ AlphaGo بعد لعب ملايين الألعاب. يمكن اعتبار اكتشاف برامج ضارة جديدة مشكلة غير قياسية مع عدم وجود حل على مستوى الإنسان حتى الآن.
يركز معظم الباحثين على نهج من أعلى إلى أسفل للذكاء مع التدريب من طرف إلى طرف لنموذج ما ، أي تحديد هدف للمشكلة العالية المستوى (على سبيل المثال تعظيم الاحتمال المتوقع للفوز) وتوقع نموذج لتعلم إيجاد حل ل المشكلات الفرعية ذات المستوى المنخفض للمشكلة الأصلية (مثل Ko القتال في Go) [18a] . تعمل هذه الطريقة مع المشكلات البسيطة نسبيًا مثل الألعاب الثابتة في البيئات المحاكاة ولكنها تتطلب قدراً هائلاً من الحلقات التدريبية (عدة أوامر بحجم أكبر من المبلغ الذي يمكن أن يتعرض له الوكيل في العالم الحقيقي) ويؤدي إلى حلول غير قابلة للتعميم (نموذج AlphaGo) المدربين على 19x19 متن غير مجدية بشكل فعال للوحة 9x9 دون إعادة تدريب كاملة). أقسى المشكلات التي يمكن حلها من قبل البشر هي مشكلات مفتوحة - لا يبحث البشر في مساحة ثابتة عن الحلول الممكنة على عكس AlphaGo [ 18b ] . عندما يكون البشر على دراية وتوجيهات بالملاحظات والتجارب في العالم الواقعي ، يتوصلون إلى مشاكل فرعية جيدة ، مثل النسبية الخاصة والعامة.
يركز عدد قليل من الباحثين [قسم "الاتجاهات المحتملة"] على النهج التصاعدي ، أي البدء ببعض الأهداف ذات المستوى المنخفض (مثل زيادة القدرة على التنبؤ بديناميات البيئة ، بما في ذلك تأثير تصرفات العامل على البيئة) ، ثم إضافة بعض المستويات العليا أهداف الدوافع الذاتية للعامل (على سبيل المثال زيادة تقدم التعلم أو زيادة الخيارات المتاحة) إلى الحد الأقصى [19 أ] [19 ب] ، وعندها فقط إضافة هدف رفيع المستوى لمشكلة تهم البشر (مثل زيادة درجة اللعبة إلى أقصى حد) [19 ج] . من المتوقع أن يؤدي هذا النهج إلى حلول أكثر تعميماً وقوة للمشاكل عالية المستوى لأن التعلم باستخدام هذه الأهداف منخفضة المستوى قد يؤدي إلى تعلم الوكيل أيضًا سلوك التوجيه الذاتي وتصحيح الذات مفيد في المواقف غير الخطرة أو الخطيرة بدون أي صفائح المعلومات المتعلقة بهم المقدمة بشكل فعال من قبل الهدف الرفيع المستوى. توفر ضرورة التكيف / البقاء أهدافًا مثالية للكائنات الحية لتوجيه التنظيم الذاتي والتعلم / التطور [20 أ] [20 ب] ، ويمكن لبعض الكائنات الحية وضع أهداف عالية المستوى لأنفسهم بعد تدريبهم / تطويرهم لتحقيق أهداف منخفضة المستوى . من الممكن تمامًا أن يتم اشتقاق مجموعة من الأهداف العالمية المنخفضة المستوى من بعض المعادلات التي تحكم تدفق الطاقة والمعلومات [21 أ] ، وبالتالي فإن التحسين باستخدام هذه الأهداف [قسم "الاتجاهات المحتملة"] قد يؤدي إلى ذكاء أجهزة الكمبيوتر في طريقة مماثلة لكيفية تطور الكون الذي يحكمه قوانين الفيزياء يؤدي إلى ذكاء الكائنات الحية [21 ب] .
على الرغم من نجاح حل المشكلات عالية المستوى في البيئات المحاكاة مثل Go ، إلا أن حل المشكلات ذات المستوى المنخفض مثل الرؤية والروبوتات لم يحقق بعد مثل هذه النجاحات. لا يمكن للبشر أن يتعلموا اللعب Go دون أن يتعلموا أولاً تمييز اللوحة ووضع الحجارة. يمكن لأجهزة الكمبيوتر حل بعض المشكلات عالية المستوى دون القدرة على حل المشاكل ذات المستوى المنخفض عندما يتم استخلاص المشكلات عالية المستوى بعيدًا عن المشكلات الفرعية ذات المستوى المنخفض من قبل البشر [22 أ] . إن المشكلات منخفضة المستوى هي أكثر تعقيدًا من الناحية الحسابية لكل من البشر وأجهزة الكمبيوتر ، على الرغم من أنها ليست بالضرورة أكثر تعقيدًا مثل المشكلات الرياضية أو الهندسية [22 ب] . إن المشكلات منخفضة المستوى هي الطريق إلى التفكير المنطقي ، أي تقدير معقولية فرضية تعسفية من الملاحظات التي تم الحصول عليها أو المتخيلة ومن جميع المعارف المكتسبة سابقًا ، وهو أمر ضروري للجهاز للتكيف مع بيئة تعسفية ولحل مشكلة تعسفية مشكلة عالية المستوى في تلك البيئة [22 د] .
العقبات
يبدو أن أكبر عقبة أمام التطبيقات في بيئات العالم الواقعي مقارنة بالبيئات المحاكاة هي أهداف غير مقيدة لتحقيق الأمثلية في تعلم نموذج البيئة [23 أ] . أي نموذج معقد بما فيه الكفاية تدرب مع هدف غير مقيد بما فيه الكفاية سوف يستغل أي نمط موجود في بيانات التدريب الذي يرتبط المدخلات إلى المتغيرات المستهدفة ولكن الارتباطات الزائفة لن تعميمها بالضرورة لاختبار البيانات [قسم "التقدم"] [23 ب] [ 23 ج] [23 د] . حتى مليار مثال لا تقيد عملية التحسين بما فيه الكفاية ولا تؤدي إلى تحقيق مكاسب كبيرة في الأداء في التعرف على الصور [24a] [24b] . يجد الوكلاء طرقًا مفاجئة لاستغلال البيئات المحاكاة لزيادة الأهداف إلى أقصى حد غير مقيدة بما يكفي لمنع عمليات الاستغلال [25 أ] [25 ب] .
تتمثل إحدى الطرق لتقييد التحسين بشكل كافٍ لتجنب الحلول غير القابلة للتعميم وغير القوية في توفير مزيد من المعلومات المفيدة للتدريب ، على سبيل المثال ، استخدام فيزياء العالم الحقيقي أو ديناميات العالم الاجتماعي كمصادر للإشارة بدلاً من البيئات المحاكاة مع العوامل المصطنعة أو البيئات الفيزيائية المقيدة التي لا تحتوي على عوامل معادية - هذه الأخيرة لا تمثل حالات الزاوية التي يواجهها الوكيل في العالم الواقعي / الاجتماعي غير المقيد [26 أ] . هناك طريقة أخرى تتمثل في الهدف الأكثر تعقيدًا من أجل التحسين ، على سبيل المثال ، تعلم التنبؤ ليس فقط بإحصاءات الاهتمام ، مثل المكافآت التراكمية المستقبلية بشرط تصرفات الوكيل التالية ، ولكن أيضًا الديناميات ، مثل بعض خصائص المستقبل التعسفي للبيئة بشكل مشروط في بعض الأحداث المستقبلية الافتراضية التعسفية بما في ذلك الإجراءات التالية للوكيل [26 ب] [ 26 ج] [26 د] [ 26 هـ ] . تتوافق الدول والمكافآت مع الملخصات الإحصائية للوكيل للتفاعل مع البيئة بينما تتوافق الديناميات مع معرفة الوكيل بكيفية عمل البيئة [27 أ] [ 27 ب ] . تقدم العامل في تعلم التنبؤ بديناميات البيئة [قسم "الاتجاهات المحتملة"] [28 أ] [28 ب] [28 ج] بالإضافة إلى تقدم العميل في إنشاء خيارات للتأثير عليها [قسم "الاتجاهات المحتملة"] [28 د] [28 هـ] [ 28f] قد يكون أقوى أنواع الدافع الجوهري للعامل وقد يكون الطريقة الأكثر فعالية لتقييد عملية التحسين.
يبدو أن ثاني أكبر عقبة تتمثل في وجود فجوة هائلة بين تعقيد البيئات المحاكاة المتاحة لأجهزة الكمبيوتر الحالية وتعقيد بيئات العالم الواقعي المتاحة للروبوتات الحالية بحيث لا يمكن نقل العامل المدرب في بيئة محاكاة إلى روبوت بطريقة حقيقية. بيئة عالمية بأداء مقبول وقوة [29] لم يستخدم فريق Boston Dynamics أبدًا التعلم الآلي للتحكم في الروبوتات الخاصة بهم - يستخدمون في الوقت الفعلي حل المعادلات التفاضلية لحساب الديناميات والتحكم الأمثل لنماذج الروبوتات والبيئات التي لم يتم تعلمها من البيانات ولكن تم تحديدها يدويًا [30] . لم يستخدم باحثو معهد ماساتشوستس للتكنولوجيا التعلم الآلي للتحكم في الروبوت الخاص بهم في DARPA Robotics Challenge 2015 ، وكان روبوتهم هو الروبوت الوحيد الذي لم يسقط أو يحتاج إلى مساعدة جسدية من البشر [31 أ] . قد لا يكون حدث الذيل قابلاً للتعلم من خلال نموذج إحصائي [31b] ، أي من خلال تشكيل طائرة مفرطة منفصلة لذلك النموذج واستخدامه كحدود قرار لاتخاذ إجراء محتمل ، وقد يتطلب بعض أشكال الاستدلال غير الإحصائي ، أي من خلال التحفيز نموذج / نظرية منطقية للحدث ، واستخلاص الفرضيات منه والتحقق منها في التجارب. وبالتالي ، قد لا يتم احتساب الإحصائيات فحسب ، بل يجب حساب ديناميات الظواهر - فقد يتعين برمجة النموذج أو تدريبه لمحاكاة ديناميات الظواهر [31 ج] .
من الممكن أن تكون الطريقة الوحيدة لتدريب / تطوير عملاء لديهم ذكاء يكفي للمشاكل الصعبة في العالم الحقيقي (مثل الروبوتات) وفي العالم الاجتماعي (مثل فهم اللغة الطبيعية) هي:
(1) لتدريب / تطوير الوكلاء في البيئات التي توفر الكثير من القيود على التحسين مثل العالم الواقعي والاجتماعي (على سبيل المثال ، قد يتعين على الوكلاء أن يكونوا روبوتات تعمل في العالم الحقيقي إلى جانب البشر) ؛
(2) لتدريب / تطوير العوامل على المشكلات التي توفر الكثير من القيود على التحسين مثل أصعب المشكلات التي تحلها الكائنات الحية في العالم الحقيقي (على سبيل المثال ، قد يتوجب على الوكلاء أن يتعلموا البقاء على قيد الحياة كروبوتات في العالم الحقيقي دون أي مساعدة مباشرة من البشر) وحلها من قبل البشر في العالم الاجتماعي (أي قد يكون على الوكلاء تعلم الوصول إلى الأهداف في العالم الحقيقي باستخدام التواصل مع البشر كأداة فقط).
التقدم
يمكن القول أنه خلال فترة نهضة التعلم العميق لم يكن هناك تقدم في مشاكل العالم الحقيقي مثل الروبوتات وفهم اللغة لا يقل أهمية عن الألعاب الثابتة التي تعمل في بيئات محاكية.
آراء حول تقدم أبحاث الذكاء الاصطناعى من بعض أكثر الباحثين واقعية:
مايكل إ. جوردان [32 أ] [32 ب] [ 32 ج]
رودني بروكس [33 أ] [ 33 ب]
فيليب بكنوفسكي [34 أ] [ 34 ب]
فرانسوا شوليت [35a] [35b]
جون لانجفورد [36 أ] [ 36 ب ]
أليكس إيربان [37]
أساليب التعلم العميق ليست قوية للغاية في مهام فهم الصورة [أوراق عن التعميم وأمثلة الخصومة أدناه ] [38 أ] [38 ب] [ 38 ج] [38 د] [ 38 ج] [38f] .
أساليب التعلم العميق لم تقترب حتى من استبدال أخصائيي الأشعة [39 أ] [39 ب] [ 39 ج] [39 د] .
أساليب التعلم العميق ليست قوية للغاية في مهام فهم النص [أوراق عن التعميم وأمثلة الخصم أدناه] [40 أ] [40 ب] .
لا يمكن لطرق التعلم العميق اجتياز المستويات الأولى من أصعب لعبة أتاري [41] .
"ObjectNet: مجموعة بيانات يتم التحكم فيها على نطاق واسع للتحيز من أجل دفع حدود نماذج التعرف على الكائنات"
"تقريب شبكات CNN مع نماذج حقيبة الميزات المحلية تعمل بشكل مدهش على ImageNet"
"قياس ميل CNNs لتعلم السطحية الإحصائية"
"الثقل المفرط يسبب ثغرة أمنية"
"هل تعرف النماذج التوليفية العميقة ما لا يعرفونه؟"
"هل يعمم مصنفو ImageNet على ImageNet؟"
"هل تعميم مصنفات CIFAR-10 على CIFAR-10؟"
"التعلم العميق من أجل تجزئة أورام الدماغ: تأثير التدريب والاختبار عبر المؤسسات"
"المتغيرات المربكة يمكن أن تؤدي إلى انخفاض أداء التعميم لنماذج التعلم العميق الإشعاعي"
"أمثلة الخصومة الطبيعية"
"هجوم بكسل واحد لخداع الشبكات العصبية العميقة"
"التناوب وإفراط في الترجمة: خداع شبكات CNN مع التحولات البسيطة"
"أمثلة الخصم الدلالي"
"لماذا تقوم الشبكات التلافيفية العميقة بالتعميم بشكل سيئ للغاية على تحويلات الصور الصغيرة؟"
"الفيل في الغرفة"
"الإضراب (مع) تشكل: الشبكات العصبية ينخدع بسهولة من قبل المواقف الغريبة من الكائنات المألوفة"
"مشغلات الخصومة العالمية لمهاجمة وتحليل البرمجة اللغوية العصبية"
"قواعد الخصم المكافئة نصف الدلالة لتصحيح نماذج البرمجة اللغوية العصبية"
"الحق للأسباب الخاطئة: تشخيص الاستدلال النحوي في الاستدلال اللغوي الطبيعي"
"التحقيق في فهم الشبكة العصبية للوسائط اللغوية الطبيعية"
الاتجاهات الممكنة
يورجن شميدهوبر
"تصبح البيانات مثيرة للاهتمام من تلقاء نفسها لبعض المراقب الذاتي الذي يتحسن ذاتيا ، لكن مراقبًا شخصيًا محدودًا من الناحية الحسابية بمجرد أن يتعلم التنبؤ أو ضغط البيانات بطريقة أفضل ، مما يجعلها أكثر بساطة وجمالًا ذاتيًا. الفضول هو الرغبة في إنشاء أو اكتشاف المزيد من البيانات غير العشوائية وغير التعسفية والمنتظمة الرواية والمدهشة ، ليس بالمعنى التقليدي لبولتزمان وشانون ، ولكن بمعنى أنها تسمح بتقدم الضغط لأن انتظامها لم يكن معروفًا بعد. مشتق من الجمال الذاتي أو الانضغاط ، أي انحدار منحنى التعلم. إنه يحفز استكشاف الرضع ، وعلماء الرياضيات الصادقين ، والملحنين ، والفنانين ، والراقصين ، والكوميديين ، نفسك ، والأنظمة الصناعية. "
يمكن اعتبار الذكاء فعالية ضغط: كلما زاد ضغط البيانات ، زاد فهمها. مثال على الزيادة في فعالية الانضغاط: 1. ملاحظات أولية عن مدارات الكواكب 2. مركزية البطالمة للدوران 3. حذف مركزية حول الشمس 4. ميكانيكا نيوتن 5. النسبية العامة 6.؟ تحت هذا الرأي ، ضغط البيانات هو فهم ، وتحسين الضاغط هو التعلم ، تقدم التحسين هو مكافأة جوهرية. لمعرفة أسرع جزء ممكن من البيانات ، يجب تقليل عدد البتات الذي يحتاجه المرء لضغط تلك البيانات بأسرع وقت ممكن. إذا كان يمكن للمرء اختيار البيانات التي يجب مراقبتها أو إنشائها ، فيجب أن يتفاعل المرء مع البيئة بطريقة للحصول على بيانات تزيد النقص في البتات - تقدم الضغط - لكل شيء معروف بالفعل.
"مبدأ حسابي بسيط وراء الإبداع والفن والعلوم والموسيقى والفكاهة"
"النظرية الرسمية للمرح والإبداع"
"النظرية الرسمية للإبداع والمرح والدافع الجوهري"
"الاستكشاف النشط والفضول الصناعي وما يثير الاهتمام"
"مدفوعًا بتقدم الضغط: مبدأ بسيط يشرح الجوانب الأساسية للجمال الشخصي ، والجدة ، والمفاجأة ، والاهتمام ، والانتباه ، والفضول ، والإبداع ، والفن ، والعلوم ، والموسيقى ، والنكات"
"النظرية الرسمية للإبداع والمرح والدافع الجوهري"
"الحد الأدنى غير الخاضع للإشراف: فضول الخصوم ، وشبكات الخصوم التوليدية ، وتقليل التوقع"
"الفضول مدفوعة التعلم التعزيز للتخطيط للحركة على humanoids"
"ما هو للاهتمام؟"
"PowerPlay: تدريب على حل المشاكل بشكل متزايد من خلال البحث المستمر عن أبسط مشكلة لا تزال غير قابلة للحل"
أليكس ويسنر-جروس
"يحتاج النظام الذكي إلى تحسين الإنتروبيا السببية في المستقبل ، أو وضعه بلغة واضحة ، وزيادة الخيارات المستقبلية المتاحة إلى الحد الأقصى. وهذا بدوره يعني تقليل جميع المواقف غير السارة مع خيارات قليلة للغاية. وهذا منطقي من وجهة نظر تطورية لأنه ثابت مع القدرة على البقاء ، فإنه يتوافق مع ما نراه بين البشر (جمع الثروة والتحوط على نتائج متعددة من الأشياء التي لا يمكن التنبؤ بها) ويولد سلوكًا معقولًا في العديد من مواقف اللعبة البسيطة. "
"معادلة الذكاء"
"فيزياء الذكاء العام الاصطناعي"
"الاستخبارات حقيقية"
"الاستخبارات تشوش الذكاء"
"قوى الانتروبيا السببية"
فيليب piekniewski
"من خلال حل مشكلة أكثر تنبؤًا جسديًا (لتمييزها عن التنبؤ الإحصائي) ، تصبح المدخلات والعلامة متوازنة تمامًا وتختفي مشكلة الاختيار البشري تمامًا. التسمية في هذه الحالة هي مجرد نسخة موقتة من المدخلات الأولية الإشارة: المزيد من البيانات يعني المزيد من الإشارات ، ويعني تقريبًا أفضل لمشعب البيانات الفعلي ، وبما أن هذه المشعب نشأت في الواقع المادي (لا ، لم يتم أخذ عينات منها من مجموعة من علماء الجاوس المستقلين والموزعين بشكل متطابق) ، فلا عجب في ذلك إن استخدام الفيزياء كنموذج للتدريب قد يساعد على كشفه بشكل صحيح ، علاوة على ذلك ، يجب أن تتم موازنة إضافة المعلمات بإضافة المزيد من القيود (إشارة تدريب إضافية) ، وبهذه الطريقة ، يجب أن نكون قادرين على بناء نظام معقد للغاية بمليارات من المعلمات (ذكريات (لا يزال يعمل على مبدأ بسيط وقوي للغاية. تعقيد الإشارة الحقيقية والثروة من بيانات التدريب عالية الأبعاد قد يمنعها من العثور على "رخيصة" ، SPU حلول ريفية. لكن التكلفة التي يتعين علينا دفعها هي أننا سنحتاج إلى حل مهمة أكثر عمومية وتعقيدًا ، والتي قد لا تترجم بسهولة وبشكل مباشر إلى أي شيء ذي أهمية عملية ، وليس على الأقل على الفور ".
"نموذج الرؤية التنبؤية - طريقة مختلفة للقيام بالتعلم العميق"
"إعادة تشغيل AI - مسلمات"
"المخابرات تربك الذكاء"
"الاستخبارات حقيقية"
"الذكاء الخاطئ ووديك"
"الإدراك الغريب لمشكلة الإدراك"
"الإحصاء والديناميات"
"رد الفعل مقابل التنبؤية AI"
"جبل المخابرات"
"تعلم الفيزياء هو الطريق للذهاب"
"رؤية تنبؤية باختصار"
"رؤية آلة الإحساس الشائعة"
"التعلم بدون إشراف من الفيديو المستمر في شبكة متكررة تنبؤية قابلة للتطوير"
"المبادئ الأساسية للحساب القشري: التعلم بدون إشراف مع التنبؤ والضغط والتغذية الراجعة"
تود هيلتون
"المشكلة الأساسية في الحوسبة اليوم هي أن أجهزة الكمبيوتر لا تستطيع تنظيم نفسها: تريليونات من درجات الحرية التي تقوم بنفس الأشياء مرارًا وتكرارًا ، وقدرات ضيقة منظمة العفو الدولية بدائية. نهجنا الآلي لمشكلة الذكاء الاصطناعي غير مناسب لمشاكل العالم الحقيقي المعقدة : الآلات هي مجموع أجزائها المنفصلة عن العالم باستثناءنا من خلالنا ، العالم ليس آلة ، الديناميكا الحرارية هي التي تحرك تطور كل شيء ، والتطور الديناميكي الحراري هو المفهوم المفقود والموحد في أنظمة الحوسبة ، والتطور الديناميكي الحراري يفترض أن جميع المنظمات عفوية يظهر من أجل استخدام مصادر الطاقة المجانية في الكون وأن هناك تنافسًا على هذه الطاقة ، فالتطور الديناميكي الحراري هو القانون الثاني للديناميكا الحرارية ، إلا أنه يضيف فكرة أنه من أجل زيادة الانتروبيا ، يجب أن تظهر منظمة تجعل من الممكن للحصول على الطاقة المجانية. القانون الأول للديناميكا الحرارية يعني أن هناك منافسة على الطاقة. "
"الحوسبة الديناميكية الحرارية"
"الحوسبة الديناميكية الحرارية"
"في الديناميكا الحرارية ومستقبل الحوسبة"
"هل الكون نتاج التطور الديناميكي الحراري؟"
ورشة الحوسبة الحرارية
"الذكاء ليس مصطنعًا"
"من الرجال والآلات"
"الشبكة العصبية الحرارية"
سوزان لا يزال
"تقوم جميع الأنظمة بإجراء العمليات الحسابية عن طريق الاستجابة لبيئتها. وتحسب النظم الحية ، على وجه الخصوص ، على أساس مجموعة متنوعة من المقاييس الطولية والوقتية ، استنادًا إلى خبرتها السابقة. معظم العمليات الحسابية البيولوجية هي في الأساس عملية غير متكافئة ، لأن إن كثرة الآلات البيولوجية في عملها الطبيعي مدفوعة بعيدًا عن التوازن الديناميكي الحراري. تتطور النظم الفيزيائية عبر سلسلة من محفزات المدخلات التي تخرج النظام من التوازن وتليها الاسترخاء إلى حمام حراري. "
"المعالجة المثلى للمعلومات"
"المعالجة المثلى للمعلومات: التبديد والمعلومات غير ذات صلة"
"الحدود الديناميكية الحرارية لمعالجة المعلومات"
"الديناميكا الحرارية للتنبؤ"
"نهج نظري للمعلومات لتعلم التعزيز القائم على الفضول"
"منهج المعلومات النظرية للتعلم التفاعلي"
كارل فريستون
"يبدو مبدأ الطاقة الحرة وكأنه محاولة لتوحيد الإدراك والإدراك والتوازن والعمل. الطاقة الحرة هي مفهوم رياضي يمثل فشل بعض الأشياء في مضاهاة أشياء أخرى يفترض أن تتنبأ بها. يحاول الدماغ تقليل طاقتها الحرة فيما يتعلق بالعالم ، أي تقليل الفرق بين النماذج والواقع ، وفي بعض الأحيان تقوم بذلك من خلال تحديث نماذجها في العالم ، وفي أحيان أخرى تقوم بذلك عن طريق تغيير العالم لتتناسب مع نماذجه بشكل أفضل. كلتا المحاولتين لإنشاء نماذج دقيقة تتناسب مع العالم ، وبالتالي تقليل الطاقة المجانية.التوازن والعمل هما محاولتان لجعل الواقع يتطابقان مع النماذج الذهنية.تحاول الحركة الحصول على الحالة الخارجية للكائن لتتناسب مع نموذج عقلي. تتوافق مع النموذج العقلي ، فبما أن البكتيريا تفعل شيئًا يشبه التوازن في المنزل ، فإن كل أشكال الحياة تشترك في مبدأ كونها مُقلِمات طاقة مجانية ، لذا فالحياة لا تفعل نانوغرام أربعة أشياء - الإدراك والتفكير والتمثيل ، والحفاظ على التوازن. إنها حقًا تفعل شيئًا واحدًا - تقليل الطاقة المجانية - بأربعة طرق مختلفة - مع الطريقة الخاصة التي تنفذ بها هذا في أي موقف معين وفقًا لفرص تقليل الطاقة المجانية الأكثر ملاءمة. "
"مبدأ الطاقة الحرة"
"طاقة مجانية واستدلال نشط"
"الاستدلال النشط والفضول الاصطناعي"
"الاستدلال النشط والفضول الاصطناعي"
"عدم اليقين والاستدلال النشط"
مقدمة لتقليل الطاقة مجانا
البرنامج التعليمي على الاستدلال النشط
البرنامج التعليمي على الطاقة الحرة والفضول
التنفيذ
"مبدأ الطاقة الحرة: نظرية دماغية موحدة؟"
"الاستكشاف والجدة والمفاجأة وتقليل الطاقة مجانًا"
"العمل والسلوك: تركيبة طاقة حرة"
"الآليات الحسابية للفضول والاستكشاف الموجه نحو الأهداف"
"توسيع المشهد الاستدلال النشط: دوافع أكثر جوهرية في حلقة التصور - العمل"
الكلمات الختامية
قد لا يتطلب حل العديد من المشكلات في العلوم / الهندسة ذكاء الكمبيوتر الموضح أعلاه - إذا استمرت أجهزة الكمبيوتر في البرمجة لحل المشكلات غير القياسية من قبل البشر كما هي اليوم. لكن بعض المشكلات المهمة (والأكثر أهمية) مثل الروبوتات (القيادة الذاتية غير المقيدة حقًا) وفهم اللغة (المساعد الشخصي الحقيقي) قد تظل دون حل دون مثل هذه الذكاء.
الإصدارات السابقة من هذه المقالة