
هناك المزيد والمزيد من أنواع الشبكات العصبية ، وهي تساعد الأشخاص على العيش والعمل. تتنبأ بعض الأنظمة بالطقس ، ويتعلم البعض إجراء التشخيصات ، وذهب جزء من الأنظمة إلى الأعمال التجارية الكبيرة. الذكاء الاصطناعي ، شكله الضعيف ، يعرف بالفعل كيفية تحليل كميات هائلة من البيانات ، وإيجاد التبعيات ، للوهلة الأولى ، بين العوامل غير ذات الصلة. ولكن ، بالطبع ، لا تزال هناك العديد من المشاكل - الذكاء الاصطناعي غير قادر على التعامل مع تحليل سلوك شخصية كرتونية "غامضة" مثل هومر سيمبسون.
لا ، يمكن للنظام تحديد بعض أفعاله ، ولكن ليس كلها. في الوقت نفسه ، تم تدريب الشبكة العصبية على عدد كبير من مقاطع فيديو YouTube من عائلة سمبسون. تجدر الإشارة إلى أن DeepMind أبعد ما يكون عن الجديد في تطوير أنظمة الذكاء الاصطناعي المختلفة. على سبيل المثال ، كان أحد تطورات هذه الشركة ، التي كانت في السابق جزءًا من Google ، وتم نقلها الآن إلى اختصاص Softbank ،
قادرًا على هزيمة أبطال
العالم في اللعبة.
أنظمة DeepMind ، وكذلك التطورات من هذا النوع من قبل الشركات الأخرى ، قادرة على تحليل كميات ضخمة من المعلومات. بمرور الوقت ، يصبح عمل الشبكات العصبية أكثر مثالية عندما يتعلمون ذاتيًا. سواء كان التعرف على الوجوه أو الترجمة من الإنجليزية إلى الصينية والعكس - النتائج تتحسن يومًا بعد يوم. من أجل تعليم نظامهم ، المسمى Kinetics ، لفهم سلوك الأشخاص ، قام موظفو DeepMind "بتغذية" أكثر من 300000 مقطع فيديو على YouTube ، وتعلموا التمييز بين حوالي 400 نوع من الإجراءات البشرية.
يقول ممثلو DeepMind: "إن أنظمة الذكاء الاصطناعي الآن جيدة جدًا في التعرف على الكائنات المختلفة في الصور ، ولكن جانبها الضعيف يعمل مع الفيديو". "أحد الأسباب الرئيسية هو عدم وجود عينات كبيرة من مقاطع الفيديو عالية الجودة."
من أجل حل هذه المشكلة ، قرر موظفو DeepMind إنشاء
نموذج خاص بهم. لكل نوع من أنواع الإجراءات الـ 400 ، تم "قص" شخص من YouTube على الأقل 400 مقطع فيديو ، تستمر لمدة 10 ثوانٍ تقريبًا. والنتيجة هي واحدة من أولى مجموعات البيانات المتخصصة عالية الجودة والمصممة لتدريس الذكاء الاصطناعي. بالطبع ، كانت شركة DeepMind ، التي شكلت هذه العينة بينما كانت لا تزال قسمًا من Google ، محظوظة لأن Google (الآن - التي تحمل Alphabet) هي مالك YouTube. وفقًا لذلك ، ربما كان بإمكان موظفي Deepmind الوصول إلى أدوات متخصصة للعمل مع مواد خدمة الفيديو. ستواجه الشركات الأخرى وقتًا أكثر صعوبة في هذا الصدد ، نظرًا لأن العثور على مقاطع فيديو عالية الجودة متاحة للجمهور لتجميع مجموعة بيانات متخصصة ليس بالسهولة التي قد تبدو عليها.
كانت دقة تحديد الحركيات المختلفة التي شوهدت في مقاطع الفيديو لأفعال الناس حوالي 80 ٪ ، وهي ليست قليلة جدًا. صحيح ، هذا ينطبق على مقاطع الفيديو العادية ، حيث يلعبون التنس ، ويهدئون الطفل الباكي ، ويصنعون توقعات الطقس ، وما إلى ذلك. في حالة هومر سيمبسون ، كل شيء أكثر تعقيدًا ، وهنا تنخفض الدقة فورًا أربع مرات ، حتى 20٪. كان من الصعب على الشبكات العصبية تحديد إجراءات هوميروس مثل قذف عملة معدنية ، وتمشيط الشعر غير الموجود (لم يتم حساب زوج الشعر المتبقي هذا) وغيرها.
بالإضافة إلى هوميروس ، من الصعب تحديد Kinetics طبق أو منتج إذا تم عرض جزء منه فقط. يتم تعريف البرغر نصف مأكول بالفعل أقل دقة بكثير من الكل. تظهر المشاكل أيضًا إذا كان الكائن صغيرًا جدًا. وفقا لممثل DeepMind ، من أجل تعليم الشبكة العصبية أن تحدد بشكل صحيح بعض الإجراءات بدرجة عالية من الدقة ، في بعض الأحيان يكفي فقط عدد قليل من مقاطع الفيديو. ولكن في بعض الأحيان لا يساعد حتى مائة في زيادة دقة تحديد إجراءات معينة.

كل هذه مشاكل معروفة. على سبيل المثال ، واجهت الشبكة العصبية نفسها في
وقت سابق صعوبات في تحديد وجوه الأشخاص الذين ينتمون إلى مجموعات عرقية معينة. وفقًا لبعض الخبراء ، فإن الخوارزميات الكامنة وراء الحركية قادرة على تحديد جنس الشخص وفقًا لبعض ميزات
الكلام والنصوص .
الشبكة العصبية من DeepMind قادرة على تحديد جنس الشخص في الفيديو (ولكن ليس بأي حال من الأحوال في جميع الحالات) ، وكذلك تقييم "التوازن بين الجنسين" لعدد من مقاطع الفيديو. على سبيل المثال ، الفيديو الذي يحتوي على شوارب حادة ولحى هو في الغالب من الذكور (الذين قد يفاجأون) ، ولكن العمل مع الحاجبين أو التشجيع هو أنثى. صحيح أن مشكلة التعرف على الجنس لا تزال قائمة ، ولدى المطورين شيء للعمل عليه هنا.
في المستقبل ، من المرجح أن يحدد العمل على هذه الأنظمة ليس فقط ما يفعله الأشخاص على الفيديو ، ولكن أيضًا سبب أفعالهم. على سبيل المثال ، يمكن للشبكة العصبية تحديد سبب هتف الشخص "أوه" ، مفسرًا سبب هذا الإجراء. وهذا يتطلب عملًا إضافيًا قويًا والعديد من مجموعات البيانات للتدريب.
ربما ، إذا قمت بتدريب Kinetics بشكل أفضل ، فسوف يتعلم هذا النظام تحديد إجراءات هومر سيمبسون. على الرغم من من يعلم ، فإن هذه شخصية لا يمكن التنبؤ بها. هل ستعمل؟