حسب بعض المعلمات ، تكون رؤية الماكينة أعلى من الإنسان. وفقا للآخرين ، وربما لن اللحاق بنا.

عندما قرر المهندسون لأول مرة تعليم أجهزة الكمبيوتر أن يروا ، فقد أخذوا أمراً مسلماً به أن أجهزة الكمبيوتر سترى كل شيء مثلما فعل الناس. وقال
جون تسوتس ، متخصص تكنولوجيا المعلومات في جامعة يورك ، إن الاقتراحات الأولى لرؤية الكمبيوتر من الستينيات كانت "مدفوعة على ما يبدو بخصائص الرؤية الإنسانية".
منذ ذلك الحين ، لقد تغير الكثير.
لقد تجاوزت رؤية الكمبيوتر مرحلة القلاع في الهواء وتحولت إلى منطقة نامية. اليوم ، تتفوق أجهزة الكمبيوتر على الأشخاص في بعض مهام التعرف على الأنماط ، على سبيل المثال ، في تصنيف الصور ("الكلب أو الذئب؟") أو اكتشاف الحالات الشاذة في الصور الفوتوغرافية الطبية. وتختلف عملية معالجة البيانات المرئية بواسطة "الشبكات العصبية" بشكل متزايد عن العملية التي يستخدمها الأشخاص.
أجهزة الكمبيوتر تغلبت علينا في لعبتنا الخاصة ، حيث تلعبها وفقًا لقواعد أخرى
الشبكات العصبية الكامنة وراء رؤية الكمبيوتر بسيطة للغاية. يتلقون صورة إدخال ومعالجتها في عدة مراحل. أولاً ، يتعرفوا على البيكسلات ، ثم الوجوه والخطوط ، ثم الكائنات كلها ، وفي النهاية يعطون حدسًا لما انزلقوا. تسمى هذه الأنظمة شبكات التوزيع العصبي المباشر لأن تشغيلها يشبه الناقل.
لا نعرف الكثير عن الرؤية الإنسانية ، لكننا نعرف أنها لا تعمل بهذه الطريقة. في تاريخنا الحديث ، "
النموذج الرياضي يكشف أسرار الرؤية "
، وصفنا نموذجًا رياضيًا جديدًا يحاول تفسير الغموض الرئيسي للرؤية الإنسانية: كيف تقوم القشرة البصرية للعقل بإعادة تكوين تمثيلات حية ودقيقة للعالم استنادًا إلى المعلومات الهزيلة التي يتلقاها من شبكية العين.
يفترض هذا النموذج أن القشرة المرئية قادرة على العمل بسبب سلسلة حلقات التغذية العصبية التي تعالج التغييرات الصغيرة في البيانات القادمة من العالم الخارجي إلى مجموعة متنوعة من الصور التي تظهر قبل إدراكنا الداخلي. تختلف عملية التغذية المرتدة هذه عن طرق الانتشار المباشر التي تعمل بها رؤية الكمبيوتر.
وقال
جوناثان فيكتور ، عالم الأعصاب في جامعة كورنيل: "يوضح هذا العمل مدى تعقيد القشرة البصرية ، وفي بعض النواحي ،" عن رؤية الكمبيوتر.
ومع ذلك ، في بعض المهام ، رؤية الكمبيوتر متفوقة على الإنسان. السؤال الذي يطرح نفسه: هل من الضروري حتى بناء مخططات رؤية الكمبيوتر على أساس الإنسان؟
بمعنى ما ، فإن الإجابة عليه ستكون سلبية. المعلومات التي تصل إلى القشرة المرئية محدودة بواسطة علم التشريح: يقوم عدد صغير نسبيا من الأعصاب بتوصيل القشرة المرئية بالعالم الخارجي ، مما يحد من كمية البيانات المرئية التي يجب أن تعمل عليها القشرة المرئية. لا تعاني أجهزة الكمبيوتر من مشاكل في النطاق الترددي ، لذلك لا يوجد سبب يجعلها تعمل مع نقص المعلومات.
"إذا كان لدي قوة حوسبية غير محدودة وذاكرة لا نهائية ، فهل سأحتاج إلى الحد من تدفق المعلومات؟ ربما لا ، قال تسوتسوس. ومع ذلك ، فهو يعتقد أن إهمال الرؤية الإنسانية أمر غير منطقي.
يقول إن مهام التصنيف التي نجحت فيها أجهزة الكمبيوتر هذه الأيام بسيطة للغاية بالنسبة لرؤية الكمبيوتر. لحل هذه المشكلات بنجاح ، تحتاج فقط إلى العثور على الارتباطات في مجموعات البيانات الضخمة. بالنسبة للمهام الأكثر تعقيدًا ، مثل فحص كائن من زوايا نظر مختلفة من أجل التعرف عليه (تقريبًا كيف يتعرف الشخص على تمثال ، ويحل حوله من جوانب مختلفة) ، قد لا تكون هذه الارتباطات كافية. لتنفيذها بشكل صحيح ، قد تضطر أجهزة الكمبيوتر إلى التعلم من شخص ما.
في العام الماضي ،
في مقابلة مع مجلتنا ، تحدثت
جوداه بيرل ، رائدة الذكاء الاصطناعي
، عن نفس الشيء في سياق أكثر عمومية ، بحجة أن التدريب على الارتباط لن يكون كافياً لتطوير أنظمة الذكاء الاصطناعي على المدى الطويل.
على سبيل المثال ، السمة الرئيسية للرؤية الإنسانية هي رد الفعل المتأخر. نعالج المعلومات المرئية ونتوصل إلى استنتاج حول ما نراه. عندما لا يناسبنا هذا الاستنتاج ، فإننا ننظر إلى ما يحدث مرة أخرى ، وغالبًا ما تخبرنا هذه النظرة الثانية بمزيد من الدقة عما يحدث. ليس لدى أنظمة رؤية الكمبيوتر التي تعمل وفقًا لنظام التوزيع المباشر مثل هذه الفرصة ، والتي غالباً ما تفشل فشلاً ذريعًا حتى في أبسط مهام التعرف على الأنماط.
الرؤية البشرية لها جانب آخر ، أقل وضوحا وأكثر أهمية تفتقر إليه رؤية الكمبيوتر.
النظام البصري البشري قد تحسن على مر السنين. في
عمل 2019 ، الذي كتبه تسوتسوس مع زملائه ، تبين أن القدرة على كبح الضجيج في مشهد مشبع بالتفاصيل والتركيز على ما يحتاجونه لا يظهر في الناس إلا في سن 17 عامًا فقط. وجد باحثون آخرون أن القدرة على التعرف على الوجوه تتحسن باستمرار حتى 20 عامًا.
تعمل أنظمة رؤية الكمبيوتر عن طريق هضم كميات هائلة من البيانات. البنية الأساسية ثابتة ولا تتغير بمرور الوقت كما يحدث في الدماغ. وإذا كانت آليات التعلم الأساسية مختلفة تمامًا ، فهل ستكون النتائج مختلفة؟ يعتقد تسوتسوس أن نظام رؤية الكمبيوتر في النهاية ينتظر الحساب.
وقال: "التعلم من أساليب التعلم العميقة هذه أبعد ما يكون عن التعلم الإنساني قدر الإمكان". "لذلك ، يبدو لي أن هناك طريق مسدود ينتظرهم". سوف يصلون إلى حد التنمية الذي لم يعد بإمكانهم الذهاب إليه. "