
في الآونة الأخيرة ، أرسلت خالتي رسائل بريد إلكتروني إلى زملائها تحت عنوان "مشكلة الرياضيات! ما هي الإجابة الصحيحة؟ " تحتوي الرسالة على أحجية بسيطة مخادعة:
1 + 4 = 5
2 + 5 = 12
3 + 6 = 21
8 + 11 =؟
بالنسبة لها ، كان القرار واضحا. لكن زملائها قرروا أن قرارهم كان صائبًا - وهو ما لا يتزامن مع قرارها. هل كانت المشكلة بإحدى إجاباتهم أم اللغز نفسه؟
تعثرت عمتي وزملاؤها على المشكلة الأساسية للتعلم الآلي ، وهو نظام يدرس تعلم الكمبيوتر. تقريبا كل التدريب الذي نتوقعه من أجهزة الكمبيوتر - والذي نقوم به بأنفسنا - يتمثل في تقليل المعلومات إلى القوانين الأساسية التي يمكن على أساسها استخلاص استنتاجات حول شيء غير معروف. وكان لغزها هو نفسه.
بالنسبة لشخص ما ، فإن المهمة هي البحث عن أي نمط. بالطبع ، حدسنا يحد من نطاق تخميناتنا. لكن أجهزة الكمبيوتر ليس لها حدس. من وجهة نظر الكمبيوتر ، فإن الصعوبة في التعرف على الأنماط تكمن في وفرتها: إذا كان هناك عدد لا نهائي من الأنماط الشرعية على قدم المساواة ، لأن بعضها صحيح والبعض الآخر ليس كذلك؟
وقد انتقلت هذه المشكلة مؤخرًا إلى مستوى عملي. حتى التسعينات ، نادرًا ما تشارك أنظمة الذكاء الاصطناعي في التعلم الآلي. لنفترض أن كمبيوتر الشطرنج Deep Thought ، سلف Deep Blue ، لم يتعلم الشطرنج بالتجربة والخطأ. بدلاً من ذلك ، أنشأ أسياد الشطرنج ومعالجو البرمجة بعناية القواعد التي يمكن للمرء من خلالها معرفة ما إذا كان وضع الشطرنج جيدًا أم سيئًا. كان هذا التعديل اليدوي الدقيق نموذجيًا لـ "الأنظمة الخبيرة" في ذلك الوقت.
لمعالجة لغز عمتي باستخدام نهج النظم الخبيرة ، من الضروري أن يحدق الشخص في الصفوف الثلاثة الأولى من الأمثلة ويلاحظ النمط التالي فيها:
1 * (4 + 1) = 5
2 * (5 + 1) = 12
3 * (6 + 1) = 21
ثم يوجه الشخص الكمبيوتر باتباع النمط x * (y + 1) = z. بتطبيق هذه القاعدة على النتيجة الأخيرة ، نحصل على حل - 96.
على الرغم من النجاحات المبكرة للأنظمة الخبيرة ، أصبح العمل اليدوي المطلوب لتطويرها وتحسينها وتحديثها أمرًا ساحقًا. بدلاً من ذلك ، لفت الباحثون الانتباه إلى تطوير آلات يمكنها التعرف على الأنماط بمفردها. يمكن للبرنامج ، على سبيل المثال ، فحص ألف صورة فوتوغرافية أو معاملات في السوق واستخلاص إشارات إحصائية مناظرة للشخص في الصورة أو ارتفاع في أسعار السوق. سرعان ما أصبح هذا النهج مهيمناً ، ومنذ ذلك الحين كان في صميم كل شيء من الفرز التلقائي للبريد وتصفية البريد العشوائي إلى الكشف عن الاحتيال في بطاقات الائتمان.
ولكن ، على الرغم من كل النجاحات ، تتطلب أنظمة MO هذه مبرمجًا في مكان ما من العملية. خذ على سبيل المثال لغز عمتي. افترضنا أنه في كل سطر هناك ثلاثة مكونات مهمة (ثلاثة أرقام في السطر). ولكن هناك عنصر رابع محتمل فيه - النتيجة من السطر السابق. إذا كانت خاصية السلسلة هذه صالحة ، فسيظهر نمط مقبول آخر:
0 + 1 + 4 = 5
5 + 2 + 5 = 12
12 + 3 + 6 = 21
وفقًا لهذا المنطق ، يجب أن تكون الإجابة النهائية 40.
أي انتظام صحيح؟ بطبيعة الحال ، كلاهما - وليس أحدهما. كل هذا يتوقف على الأنماط المسموح بها. يمكنك ، على سبيل المثال ، بناء نمط عن طريق أخذ الرقم الأول ، والضرب في الثاني ، وإضافة خمس مجموع الإجابة السابقة وثلاثة ، وتقريبها كلها إلى أقرب عدد صحيح (غريب جدًا ، لكنه يعمل). وإذا سمحنا باستخدام الخصائص المتعلقة بمظهر الأرقام ، فربما يكون هناك تسلسل مرتبط بالخطوط والخطوط. يعتمد البحث عن الأنماط على افتراضات المراقب.
وينطبق الشيء نفسه على MO. حتى عندما تقوم الآلات بتدريب نفسها ، يتم اختيار الأنماط المفضلة من قبل الأشخاص: هل يجب أن تحتوي برامج التعرف على الوجوه على قواعد صريحة إذا / أو ، أو يجب أن تعتبر كل ميزة كدليل إضافي لصالح أو ضد كل شخص محتمل ينتمي إليه الشخص؟ ما ميزات الصورة التي يجب أن يتعامل معها البرنامج؟ هل تحتاج للعمل مع وحدات البكسل الفردية؟ أو ربما مع الحواف بين المناطق الفاتحة والمظلمة؟ يحد اختيار هذه الخيارات من الأنماط التي يعتبرها النظام محتملة أو حتى ممكنة. لقد أصبح البحث عن هذا المزيج المثالي هو العمل الجديد للمتخصصين في وزارة الدفاع.

لكن عملية الأتمتة لم تتوقف عند هذا الحد. مثلما تم تعذيب المبرمجين ذات مرة لكتابة قواعد العمل ، أصبحوا الآن مترددين في تطوير ميزات جديدة. "أليس من اللطيف أن يتمكن الكمبيوتر نفسه من معرفة الميزات التي يحتاجها؟" لذلك قاموا بتطوير شبكة عصبية عميقة التعلم ، وهي تقنية MO يمكنها أن تستخلص بشكل مستقل استنتاجات حول الخصائص عالية المستوى بناءً على معلومات أبسط. قم بتغذية مجموعة من البكسل إلى شبكة عصبية ، وسيتعلم مراعاة الحواف والمنحنيات والقوام - وكل هذا بدون تعليمات مباشرة.
وهكذا ، فقد المبرمجون وظائفهم بسبب خوارزمية واحدة ، لتحرير الجميع؟
ليس بعد. لا تزال الشبكات العصبية غير مناسبة بشكل مثالي لأية مهام. حتى في أفضل الحالات ، يجب تعديلها. تتكون الشبكة العصبية من طبقات من "الخلايا العصبية" ، يقوم كل منها بإجراء حسابات بناءً على بيانات الإدخال ويخرج النتيجة إلى الطبقة التالية. ولكن كم عدد الخلايا العصبية المطلوبة وعدد الطبقات؟ هل يجب أن يتلقى كل عصبون مدخلات من كل عصبون من المستوى السابق ، أم يجب أن تكون بعض الخلايا العصبية أكثر انتقائية؟ ما التحويل الذي يجب على كل خلية عصبية إجراؤه على بيانات الإدخال للحصول على النتيجة؟ وهكذا دواليك.
تحد هذه القضايا من محاولات تطبيق الشبكات العصبية على المهام الجديدة ؛ شبكة عصبية تتعرف على الوجوه تمامًا غير قادرة تمامًا على الترجمة التلقائية. ومرة أخرى ، من الواضح أن العناصر الهيكلية التي اختارها الإنسان تدفع الشبكة نحو قوانين معينة ، وتقودها بعيدًا عن غيرها. يفهم الشخص المطلع أنه ليست جميع القوانين متساوية. لن يتم ترك المبرمجين بدون عمل.
بالطبع ، ستكون الخطوة المنطقية التالية هي الشبكات العصبية ، وتخمين بشكل مستقل عدد الخلايا العصبية التي يجب تضمينها ، وما هي الروابط التي يجب استخدامها ، وما إلى ذلك. كانت المشاريع البحثية حول هذا الموضوع جارية لسنوات عديدة.
إلى أي مدى يمكن أن تذهب؟ هل ستتعلم السيارات العمل بمفردها بحيث تتحول الضبط الخارجي إلى بقايا قديمة؟ من الناحية النظرية ، يمكن للمرء أن يتخيل طالبًا عالميًا مثاليًا - طالبًا يمكنه حل كل شيء لنفسه ، ويختار دائمًا أفضل مخطط للمهمة المختارة.
لكن في عام 1996 ، أثبت اختصاصي علوم الكمبيوتر ديفيد والبيرت استحالة مثل هذا الطالب. في "نظرياته الشهيرة حول عدم وجود وجبات مجانية" ، أظهر أنه بالنسبة لأي نمط يتدرب فيه الطالب جيدًا ، هناك نمط سيدرسه بشكل رهيب. هذا يعيدنا إلى سر عمتي - إلى عدد لا نهائي من الأنماط التي يمكن أن تنشأ من البيانات المحدودة. إن اختيار خوارزمية التدريب يعني اختيار الأنماط التي ستتعامل معها الماكينة بشكل سيئ. ربما تقع جميع المهام ، على سبيل المثال ، التعرف على الأنماط ، في نهاية المطاف في خوارزمية واحدة شاملة. ولكن لا يمكن لأي خوارزمية تعلم أن تتعلم كل شيء بشكل متساوٍ.
وهذا يجعل التعلم الآلي يبدو وكأنه دماغ بشري. على الرغم من أننا نحب أن نعتبر أنفسنا أذكياء ، فإن دماغنا لا يدرس تمامًا. يتم ضبط كل جزء من الدماغ بعناية من خلال التطور للتعرف على أنماط معينة - سواء كان ذلك ما نراه ، أو اللغة التي نسمعها ، أو سلوك الأشياء المادية. لكننا لا نقوم بعمل جيد مع البحث عن الأنماط في سوق الأسهم. هنا هزمتنا الآلات.
يحتوي تاريخ التعلم الآلي على العديد من الأنماط. ولكن على الأرجح سيكون ما يلي: سنقوم بتدريب الآلات للتعلم لسنوات عديدة أخرى.