واجه التعلم الآلي مشكلة في الرياضيات لم يتم حلها

تحية ، الخبروفيت! تحسبا لإطلاق سلاسل جديدة في الدورات المتقدمة والأساسية "الرياضيات لعلوم البيانات" ، نريد أن نطلعكم على ترجمة مثيرة للاهتمام إلى حد ما. لن تكون هناك ممارسة في هذه المقالة ، ولكن المواد مثيرة للاهتمام للتنمية العامة والمناقشة.





واجهت مجموعة من الباحثين مشكلة رياضية مفتوحة مرتبطة بعدد من التناقضات المنطقية التي اكتشفها عالم الرياضيات النمساوي الشهير كورت غودل في الثلاثينيات.

أثبت علماء الرياضيات الذين عملوا على مشاكل التعلم الآلي أن إمكانية "التعلم" ، أي ما إذا كانت الخوارزمية يمكنها استخراج نمط من بيانات محدودة ، ترتبط ارتباطًا وثيقًا بالمفارقة المعروفة باسم فرضية التواصل. قال جودل إنه باستخدام الإمكانات القياسية للغة الرياضية ، لا يمكن تأكيد فرضية أو دحضها. تم نشر أحدث نتائج الأبحاث حول هذا الموضوع في Nature Machine Intelligence في 7 يناير .

وقال أمير يهوداييف من معهد التخنيون في إسرائيل في هيف الذي شارك في إعداد الدراسة "لقد كانت مفاجأة لنا". وقال إنه على الرغم من عدد من المشكلات الفنية ، والتي تُعرف أيضًا باسم "غير قابلة للذوبان" ، لم يكن يتوقع حدوث هذه الظاهرة في مشكلة التعليم الآلي التي تبدو بسيطة.

يقول جون تاكر ، المتخصص في علوم الكمبيوتر بجامعة سوانسي بالمملكة المتحدة ، إن هذا العمل "نتيجة ملموسة على حافة معرفتنا" ، مع انعكاسات أساسية لكل من الرياضيات والتعلم الآلي.

ليس كل مجموعات هي نفسها.


غالبًا ما يحدد الباحثون قابلية التعلم من حيث ما إذا كانت الخوارزمية يمكنها تعميم معرفتها. تجيب الخوارزمية على "نعم" أو "لا" ، على سبيل المثال ، على السؤال "هل هناك قطة في الصورة؟" بالنسبة لعدد محدود من الكائنات ، وبعد ذلك يجب أن تقوم بعمل تنبؤ لكائنات جديدة لم تكن معروفة من قبل.

حصل يهوداييف وزملاؤه على نتائج من خلال دراسة العلاقة بين التعلم و "الضغط" ، والتي تتضمن إيجاد طريقة لتعيين السمات المميزة لمجموعة كبيرة من البيانات لمجموعة أصغر. وجد الباحثون أن قدرة المعلومات على الضغط بشكل فعال تقل عن مسألة نظرية المجموعات - مجموعات رياضية من الكائنات ، مثل مجموعات في مخططات فين. على وجه الخصوص ، ينطبق هذا على مجموعات من مختلف الأحجام تحتوي على عدد كبير لا حصر له من الكائنات.

لقد أثبت جورج كانتور ، مؤسس نظرية المجموعات ، في سبعينيات القرن التاسع عشر أن جميع المجموعات اللانهائية ليست متساوية: على سبيل المثال ، مجموعة الأعداد الصحيحة هي "أقل" من مجموعة جميع الأعداد الحقيقية ، والمعروفة أيضًا باسم التواصل. (نظرًا لأن الأعداد الحقيقية تشمل الأرقام غير المنطقية وكذلك الأرقام المنطقية والأعداد الصحيحة.) اقترح Cantor أيضًا أنه لا توجد مجموعات من الحجم الوسيط ، أي أكبر من مجموعة الأعداد الصحيحة ، ولكن أصغر من الاستمرارية. لكنه لم يستطع إثبات هذه الفرضية المتصلة بالتواصل ، مثل العديد من علماء الرياضيات والأخصائيين - أتباعه.

كانت جهودهم تذهب سدى. في عام 1940 ، أجرى غودل دراسة (لم تكتمل إلا في الستينيات من قبل عالم الرياضيات الأمريكي بول كوهين) ، والتي أثبت فيها ، باستخدام البديهيات ، أن فرضية الاستمرارية يمكن أن تكون غير صحيحة ولا خاطئة.

يعترف عمل جودل وكوهين حول فرضية الاستمرارية بأنه قد يكون هناك أكوان رياضية موازية تلبي قوانين الرياضيات المعيارية: عالم تصبح فيه فرضية الاستمرارية بديهية مقبولة عمومًا ، أي ، يتم الإعلان عن صحتها ، والثانية التي يُعلن فيها أنها خاطئة أيضًا.

الطرف التعلم


في أعمالهم الأخيرة ، يعرف يهوداييف وزملاؤه التعلم بأنه القدرة على عمل تنبؤات لبيانات كبيرة نسبيًا عن طريق أخذ عينات صغيرة من نقاط البيانات. العلاقة مع مشكلة Cantor هي أن هناك العديد من الطرق بلا حدود لاختيار مجموعة أصغر ، ولكن حجم هذه اللانهاية غير معروف.

علاوة على ذلك ، يوضح المؤلفون أنه إذا كانت فرضية الاستمرارية صحيحة ، فإن عينة صغيرة تكفي للاستقراء. ولكن إذا كانت خاطئة ، فلا يمكن أن تكون هناك عينة محدودة كافية. وبالتالي ، فإنهم يعتقدون أن مشكلة التعلم تعادل في الواقع فرضية التواصل. ونتيجة لذلك ، فإن مشكلة التعلم هي أيضًا في حالة من عدم اليقين ، والتي لا يمكن حلها إلا عن طريق اختيار كون بديهي.

يقول يهوداييف: "تساعد نتائج الدراسة أيضًا في بناء فهم أوسع للتعلم". "هذه العلاقة بين الضغط والتعميم أمر أساسي حقًا في فهم عملية التعلم."

يقول بيتر أوهيرن ، أخصائي علوم الكمبيوتر في جامعة لندن كوليدج: "اكتشف الباحثون عددًا من هذه المشكلات" غير القابلة للذوبان ". على وجه الخصوص ، وفقًا لنتائج عمل Godel ، اكتشف آلان تورينج ، أحد مؤسسي نظرية الخوارزميات ، فئة من الأسئلة التي لا يمكن ضمان برنامج كمبيوتر للإجابة عليها لأي عدد محدد من الخطوات.

ويضيف أوهيرن: "ومع ذلك ، فإن القابلية للذوبان التي تم الحصول عليها في الدراسات الحديثة نادرة للغاية وأكثر إثارة للدهشة" ، وهذا يشير إلى أن جودل اكتشف عدم اكتمال أي نوع من أنواع اللغة الرياضية الداخلية. من المحتمل أن تكون النتائج التي تم الحصول عليها مهمة لنظرية التعلم الآلي ، ولكن من غير المحتمل أن يكون لهذا تأثير كبير عملي.

اكتب التعليقات التي تفكر فيها حول هذه المادة ، وندعوك إلى ندوة عبر الإنترنت مجانًا ، والتي سنتحدث فيها عن طرق تحليل الانحدار في علوم البيانات .

Source: https://habr.com/ru/post/ar484238/


All Articles