كتاب "مهندسي الذكاء"

صورة الذكاء الاصطناعي (AI) ينتقل بسرعة من الخيال العلمي إلى الحياة اليومية. تتعرف الأجهزة الحديثة على الكلام البشري ، وتكون قادرة على الإجابة على الأسئلة وتنفيذ الترجمة الآلية. في مجموعة متنوعة من المناطق ، بدءًا من قيادة مركبة غير مأهولة وحتى تشخيص السرطان ، يتم استخدام خوارزميات التعرف على الكائنات المستندة إلى الذكاء الاصطناعي وهي متفوقة على القدرات البشرية. تستخدم شركات الإعلام الكبيرة الصحافة الآلية لإنشاء مقالات مماثلة لحقوق الطبع والنشر من البيانات التي تم جمعها. من الواضح أن الذكاء الاصطناعى مستعد لأن تصبح تقنية عالمية حقًا ، مثل الكهرباء.

ما هي الأساليب والتقنيات التي تعتبر أكثر واعدة؟ ما هي الاكتشافات الرئيسية الممكنة في السنوات القادمة؟ هل من الممكن إنشاء آلة تفكير حقًا أو منظمة العفو الدولية يمكن مقارنتها بالإنسان ، وكيف سيتم ذلك قريبًا؟ ما هي المخاطر والتهديدات المرتبطة بمنظمة العفو الدولية ، وكيفية تجنبها؟ هل ستسبب الذكاء الاصطناعي الفوضى في الاقتصاد وسوق العمل؟ هل ستخرج الأجهزة الذكية عن السيطرة البشرية وتصبح تهديدًا حقيقيًا؟

بالطبع ، من المستحيل التنبؤ بالمستقبل. ومع ذلك ، فإن الخبراء يعرفون المزيد عن الوضع الحالي للتكنولوجيا ، وكذلك عن الابتكارات في المستقبل القريب ، أكثر من أي شخص آخر. سيكون لديك لقاءات رائعة مع أشخاص معترف بهم مثل R. Kurzweil ، D. Hassabis ، J. Hinton ، R. Brooks وغيرها الكثير.

يان ليكون


نائب رئيس ومدير مختبر أبحاث الذكاء الاصطناعى في فيسبوك (FAIR) ، أستاذ علوم الحاسب الآلي في جامعة نيويورك

إلى جانب جيفري هينتون وجوشوا بنجيو ، يعد إيان ليكون جزءًا من مجموعة من الباحثين الذين أدت جهودهم ومثابرتهم إلى الثورة الحالية فيما يتعلق بالشبكات العصبية والتعلم العميق. أثناء عمله في Bell Labs ، اخترع الشبكات العصبية التلافيفية. حصل على دبلوم مهندس كهربائي في باريس من ESIEE ، ودكتوراه في علوم الكمبيوتر من جامعة بيير وماري كوري. بعد المدرسة العليا ، عمل في مختبر جيفري هينتون بجامعة تورنتو.

مارتن فورد: إن انفجار الاهتمام بالتعلم العميق على مدى السنوات العشر الماضية هو نتيجة للتحسين المتزامن للشبكات العصبية ، وزيادة قوة أجهزة الكمبيوتر وكمية البيانات المتاحة؟

يانغ ليكون: نعم ، لكن العملية كانت أكثر تعمداً. ظهرت في 1986-87. خوارزمية backpropagation جعلت من الممكن تدريب الشبكات العصبية متعددة الطبقات. تسبب هذا في موجة من الاهتمام استمرت حتى عام 1995. في عام 2003 ، توصلت جيفري هينتون وجوشوا بينجو إلى خطة لتجديد اهتمام المجتمع بهذه الأساليب لأنهم كانوا واثقين من انتصارهم الوشيك. لذلك يمكننا القول أن هناك مؤامرة متعمدة.

M.F: هل فهمت بالفعل كل الاحتمالات؟ الذكاء الاصطناعي والتعلم العميق يعتبران الآن مترادفين.

أنا لام: نعم ولا. كنا نعلم أن الطرق ستشكل أساس رؤية الكمبيوتر ، والتعرف على الكلام ، وربما بضعة أشياء أخرى ، ولكن لم يتوقع أحد أنها سوف تمتد لفهم اللغة الطبيعية ، والروبوتات ، وتحليل التصوير الطبي ، وحتى تساهم في ظهور المركبات غير المأهولة. في أوائل التسعينات. اعتقدت أن الحركة نحو هذه الأشياء ستكون أكثر سلاسة ، وستظهر قبل ذلك بقليل. كنا ننتظر الثورة التي حدثت حوالي عام 2013.

M.F: وكيف نشأت اهتمامك في الذكاء الاصطناعى والتعلم الآلي؟

Y. L: منذ الطفولة كنت مهتمًا بالعلوم والتكنولوجيا والقضايا العالمية حول أصل الحياة والذكاء وأصل البشرية. فكرة الذكاء الاصطناعى سحرتني. لكن في الستينيات والسبعينيات. لم يفعل أحد هذا في فرنسا ، لذلك بعد المدرسة ذهبت للدراسة كمهندس.

في عام 1980 ، أعجبت حقًا بكتاب فلسفة اللغة والتعلم: النقاش بين جان بياجيه ونوم تشومسكي ("اللغة والتعلم: مناقشة بين جان بياجيه ونوام تشومسكي") ، حيث ناقش المبدع نظرية التطور المعرفي واللغوي الطبيعة والتعليم ، وكذلك ظهور اللغة والذكاء.

على جانب بياجيه ، تحدث أستاذ معهد ماساتشوستس للتكنولوجيا سيمور بيبرت عن أصول التعلم الآلي في أواخر الستينيات. ساهم بالفعل في وقف العمل مع الشبكات العصبية. والآن ، وبعد 10 سنوات ، امتدح ما يسمى بـ perceptron - وهو نموذج بسيط للغاية للتعلم الآلي الذي ظهر في الخمسينيات. والتي كان يعمل في 1960s. لذلك ، ولأول مرة تعرفت على مفهوم التعلم الآلي وكنت مفتونة به تمامًا. القدرة على التعلم ، فكرت في جزء لا يتجزأ من الذكاء.

كطالب ، قرأت كل ما يمكن أن أجده في التعلم الآلي وقمت بعدة مشاريع حول هذا الموضوع. اتضح أنه في الغرب لا أحد يعمل مع الشبكات العصبية. عمل بعض الباحثين اليابانيين على ما أصبح يعرف لاحقًا بهذا المصطلح. في بلدنا ، لم يكن هذا الموضوع موضع اهتمام أي شخص ، ويعزى ذلك جزئيًا إلى ما ظهر في أواخر الستينيات. كتب ببيرت ومينسكي.

بدأت بحثًا مستقلًا وفي عام 1987 دافعت عن نماذج أطروحة الدكتوراه الخاصة بي ، connexionnistes de l'apprentissage ("نماذج التعلم في الوصل"). لم يتناول مديري موريس ميلغرام هذا الموضوع وأخبرني مباشرة أنه يمكن أن يصبح مستشارًا رسميًا ، لكنه لم يستطع مساعدتي تقنيًا.

في أوائل الثمانينات لقد اكتشفت مجتمعًا من الأشخاص الذين عملوا على الشبكات العصبية واتصلوا بها. نتيجة لذلك ، بالتوازي مع ديفيد روميلهارت وجيفري هينتون ، اكتشفت شيئًا ما مثل طريقة انتشار الخطأ مرة أخرى.

M.F: هذا هو ، في أوائل 1980s. في كندا ، كانت هناك العديد من الدراسات في هذا المجال؟

Y. L: لا ، حدث كل شيء في الولايات المتحدة الأمريكية. في كندا ، لم يتم إجراء هذه الدراسات بعد. في أوائل الثمانينات كان جيفري هينتون موظفًا في جامعة كاليفورنيا في سان دييغو ، حيث عمل مع علماء النفس المعرفي مثل ديفيد روميلهارت وجيمس مكليلاند. ونتيجة لذلك ، ظهر كتاب يشرح علم النفس بمساعدة الشبكات العصبية البسيطة ونماذج الكمبيوتر. أصبح جيفري أستاذا مساعدا في جامعة كارنيجي ميلون. انتقل فقط إلى تورونتو في عام 1987. ثم انتقلت إلى تورونتو وعملت في مختبره لمدة عام.

M.F: في أوائل 1980s. كنت طالبًا في علوم الكمبيوتر ، ولا أتذكر أنه تم استخدام الشبكات العصبية في مكان ما. الآن تغير الوضع بشكل كبير.

Y. L .: الشبكات العصبية ليست فقط على هامش العلوم. في 1970s وبداية الثمانينات. كانوا في الواقع محرومين. تم رفض المقالات لإشارة واحدة من الشبكات العصبية.

المقال الشهير Optimal Perceptual Inference ، الذي نشره جيفري هينتون وتيري سينوفسكي عام 1983. لوصفها أحد النماذج الأولى للتعلم العميق والشبكة العصبية ، استخدموا كلمات مشفرة ، حتى في الاسم.

M.F: أنت معروف باسم مؤلف شبكة عصبية تلافيفية . يرجى توضيح ما هو؟

Y. L .: في البداية ، تم تحسين هذه الشبكة العصبية للتعرف على الكائنات في الصور. لكن اتضح أنه يمكن تطبيقه على مجموعة واسعة من المهام ، مثل التعرف على الكلام والترجمة الآلية. تم تقديم فكرة ابتكارها عن طريق ميزات القشرة البصرية لدماغ الحيوانات والبشر ، والتي تمت دراستها في الخمسينيات والستينيات. ديفيد هوبيل وتورستن ويزل ، اللذان حصلا على جائزة نوبل في علم الأمراض العصبية.

الشبكة التلافيفية هي وسيلة خاصة لتوصيل الخلايا العصبية التي ليست نسخة دقيقة من الخلايا العصبية البيولوجية. في الطبقة الأولى - طبقة الالتواء - ترتبط كل خلية عصبية بعدد صغير من وحدات بكسل الصورة وتحسب المبلغ المرجح لبيانات الإدخال الخاصة بها. أثناء التدريب ، تتغير الأوزان. ترى مجموعات من الخلايا العصبية مساحات صغيرة من الصورة. إذا اكتشفت الخلايا العصبية ميزة معينة في منطقة ما ، فإن الخلية العصبية الأخرى ستكتشف بالضبط نفس الميزة في المنطقة المجاورة ، وجميع الخلايا العصبية الأخرى في المناطق المتبقية من الصورة. العملية الرياضية التي تؤديها الخلايا العصبية معا تسمى الالتواء المنفصل. ومن هنا الاسم.

ثم تأتي الطبقة غير الخطية ، حيث يتم تشغيل أو إيقاف كل خلية عصبية ، وهذا يتوقف على ما إذا كان المبلغ المرجح المحسوب بواسطة طبقة الالتواء أعلى أو أقل من الحد المحدد. أخيرًا ، تنفذ الطبقة الثالثة عملية اختزال للتأكد من أن التحيز أو التشوه الطفيف في صورة الإدخال لا يغير إلى حد كبير المخرجات. هذا يوفر الاستقلال عن تشوهات صورة الإدخال.

في الواقع ، فإن الشبكة التلافيفية هي مجموعة مكدسة تم تنظيمها من طبقات من الالتواء ، وعدم الخطية ، والعينة الفرعية. عندما يتم طيها ، تظهر الخلايا العصبية التي تتعرف على الأشياء. على سبيل المثال ، يتم تشغيل الخلايا العصبية عندما يكون الحصان على الصورة ، وخلية أخرى للسيارات ، وثالثة للأشخاص ، وهكذا ، لجميع الفئات التي تحتاج إليها.

علاوة على ذلك ، فإن ما تقوم به الشبكة العصبية يتم تحديده بواسطة قوة الروابط بين الخلايا العصبية ، أي الأوزان. وهذه الأوزان ليست مبرمجة ، بل هي نتيجة للتدريب.

يتم عرض صورة الحصان للشبكة ، وإذا لم تجيب على "الحصان" ، فسيتم إعلامك أن هذا خطأ ، وسيطلب منك الإجابة الصحيحة. بعد ذلك ، باستخدام خوارزمية الانتشار الخلفي للخطأ ، تقوم الشبكة بضبط أوزان جميع الاتصالات بحيث تظهر الصورة نفسها في المرة التالية ، وتكون النتيجة أقرب إلى المستوى المطلوب. في الوقت نفسه ، عليك أن تظهر لها الآلاف من الصور.

م. ف .: هل هذا التدريس مع معلم؟ كما أفهمها ، الآن هذا هو النهج السائد.

Y. L .: بالضبط. تقريبا جميع تطبيقات التعلم العميق الحديثة تستخدم تدريب المعلمين. السحر هو أن الشبكة المدربة في معظمها تعطي الإجابات الصحيحة حتى بالنسبة للصور التي لم تظهر من قبل. لكنه يحتاج إلى عدد كبير من الأمثلة.

M.F: وماذا يمكن توقعه في المستقبل؟ هل سيكون من الممكن تعليم سيارة كطفل ، الذي يحتاج فقط لإظهار قطة مرة واحدة وتسميتها؟

أنا L: في الواقع ، أنت لست على حق تماما. تدريبات التلافيف الأولى تدور حول ملايين الصور من مختلف الفئات. وبعد ذلك ، إذا كنت بحاجة إلى إضافة فئة جديدة ، على سبيل المثال ، قم بتعليم الكمبيوتر للتعرف على القطط ، فبعض العينات يكفي. بعد كل شيء ، تم تدريب الشبكة بالفعل على التعرف على الأشياء من أي نوع تقريبا. تتعلق الإضافات إلى التدريب بزوج من الطبقات العليا.

MF: يبدو بالفعل مثل الطريقة التي يدرس بها الأطفال.

Y. L.: لا ، للأسف ، هذا ليس على الإطلاق مثل هذا. يحصل الأطفال على معظم المعلومات قبل أن يخبرهم أحدهم ، "هذه قطة". في الأشهر القليلة الأولى من الحياة ، يتعلم الأطفال دون أدنى فكرة عن اللغة. يتعرفون على بنية العالم من خلال مراقبة العالم والتفاعل معه قليلاً. هذه الطريقة لتجميع المعرفة غير متاحة للآلات. كيف نسميها ليست واضحة. يستخدم البعض المصطلح الاستفزازي "التدريس بدون معلم". وهذا ما يسمى أحيانا التدريب الاستباقي ، أو الاستقرائي. أنا أسميها الدراسة الذاتية. عند التدريب على هذا النوع ، لا يوجد أي شك في الاستعداد لأداء مهمة ، فهي ببساطة تراقب العالم وكيف تعمل.

M.F: هل تندرج التعلم المعزز في هذه الفئة؟

Y. L: لا ، هذه فئة مختلفة تمامًا. في الواقع ، هناك ثلاث فئات رئيسية: التعلم المعزز ، تدريب المعلمين ، والتعلم الذاتي.

يتم التدريب باستخدام التعزيزات عن طريق التجربة والخطأ ويعمل بشكل جيد للألعاب حيث يمكنك إجراء العديد من المحاولات كما تريد. تم تحقيق الأداء الجيد لشركة AlphaGo بعد أن لعبت الآلة المزيد من الألعاب أكثر من البشرية جمعاء في آخر ثلاثة آلاف عام. للمشاكل من العالم الحقيقي ، مثل هذا النهج غير عملي.

يمكن لأي شخص تعلم قيادة السيارة في 15 ساعة من التدريب دون تصطدم بأي شيء. إذا كنت تستخدم أساليب التدريب الحالية مع التعزيزات ، فإن السيارة ، من أجل معرفة كيفية القيادة بدون سائق ، يجب أن تسقط منحدر صخري 10 آلاف مرة قبل أن تفهم كيفية تجنب ذلك.

م. ف.: يبدو لي أن هذه حجة لصالح النمذجة.

Y. L .: بدلاً من ذلك ، إنه تأكيد على أن نوع التدريب الذي يستخدمه الناس يختلف تمامًا عن التعلم المعزز. هذا يشبه التدريب التعزيز القائم على نموذج. بعد كل شيء ، فإن الشخص الذي يقود سيارة لأول مرة لديه نموذج من العالم ويمكنه التنبؤ بعواقب أفعاله. المشكلة الرئيسية التي لم يتم حلها هي كيفية جعل الآلة لدراسة النماذج النذير بشكل مستقل.

M.F: هل هذا هو ما عملك حول الفيسبوك؟

أنا L: نعم ، هذا هو واحد من الأشياء التي نعمل عليها. نقوم أيضًا بتدريب الجهاز على مراقبة مصادر البيانات المختلفة. نحن نبني نموذجًا للعالم ، ونأمل في انعكاس الحس السليم فيه ، بحيث يمكن استخدامه لاحقًا كنموذج تنبؤي.

M.F: بعض الناس يعتقدون أن التعلم العميق وحده لا يكفي ، ويجب أن يكون هناك في البداية بنية مسؤولة عن الذكاء. ويبدو أنك مقتنع بأن الذكاء يمكن أن ينشأ عضويا من الشبكات العصبية العالمية نسبيا.

Y. L: أنت تبالغ. الجميع يتفق مع ضرورة الهيكل ؛ والسؤال هو كيف ينبغي أن ننظر. عند التحدث عن الأشخاص الذين يعتقدون أنه يجب أن تكون هناك هياكل توفر التفكير المنطقي والقدرة على الجدال ، فربما تعني غاري ماركوس ، وربما أورن إتزيوني. لقد جادلنا مع غاري حول هذا الموضوع هذا الصباح. لا يلقى هذا الرأي قبولا حسنا في المجتمع ، لأنه دون أن يقدم أي مساهمة في التعلم العميق ، فقد كتب عن هذا الموضوع بشكل نقدي. عمل أورين في هذا المجال لبعض الوقت وفي الوقت نفسه يتحدث أكثر ليونة.

في الواقع ، نشأت فكرة الشبكات التلافيفية كمحاولة لإضافة بنية إلى الشبكات العصبية. والسؤال هو: ما الذي يسمح للجهاز بالتلاعب بالأحرف أو ، على سبيل المثال ، المطابق للسمات الهرمية للغة؟

يتفق العديد من زملائي ، بمن فيهم جيفري هينتون وجوشوا بينجيو ، على أنه يمكننا عاجلاً أو آجلاً الاستغناء عن الهياكل. يمكن أن تكون مفيدة على المدى القصير ، لأن طريقة التعلم الذاتي لم يتم اختراعها بعد. يمكن التحايل على هذه النقطة من خلال ربط كل شيء بالهندسة المعمارية. لكن البنية المجهرية للقشرة البصرية سواء الأمامية أو الأمامية ، تبدو متجانسة تمامًا.

M.F.: هل يستخدم الدماغ شيئًا مشابهًا لطريقة انتشار الخطأ؟

أنا لام: هذا غير معروف. قد يتضح أن هذا ليس هو الانتشار الخلفي في النموذج كما نعرفه ، ولكنه شكل مماثل لتقريب التدرج. عمل جوشوا بينجيو على أشكال مقبولة بيولوجيًا لتقدير التدرج. هناك فرصة أن يقوم المخ بتقدير تدرج أي وظيفة مستهدفة.

M.F: ما هي الأشياء الهامة الأخرى التي يجري العمل عليها في Facebook؟

Y. L .: نحن منخرطون في مجموعة متنوعة من البحوث الأساسية ، وكذلك قضايا التعلم الآلي ، وبالتالي ، فإننا نتعامل بشكل رئيسي مع الرياضيات التطبيقية والتحسين. يجري العمل على التعلم المعزز وما يسمى بالأنماط التوليدية ، والتي هي شكل من أشكال التعلم الذاتي أو التعلم الاستباقي.

MF: هل يقوم Facebook بتطوير أنظمة يمكنها الحفاظ على المحادثة؟

Y. L .: لقد أدرجت موضوعات البحث الأساسية أعلاه ، ولكن هناك أيضًا العديد من مجالات تطبيقها. يعمل Facebook بنشاط على تطوير التطورات في مجال رؤية الكمبيوتر ، ويمكن القول إن لدينا أفضل مجموعة بحثية في العالم. نحن نعمل كثيرًا على معالجة النصوص بلغة طبيعية. يتضمن هذا الترجمة والتعميم والتصنيف (معرفة الموضوع الذي تتم مناقشته) وأنظمة الحوار للمساعدين الظاهريين وأنظمة الأسئلة والأجوبة ، إلخ.

M.F: هل تعتقد أنه في يوم من الأيام سيكون هناك AI يمكنه اجتياز اختبار تورينج؟

أولاً - لام: سيحدث هذا في وقت ما ، لكنني لا أعتبر اختبار تورينج معيارًا جيدًا: فمن السهل أن يخدع ، وهو قديم إلى حد ما. ينسى الكثيرون أو يرفضون الاعتقاد بأن اللغة ظاهرة ثانوية فيما يتعلق بالذكاء.

»يمكن الاطلاع على مزيد من المعلومات حول الكتاب على موقع الناشر
» المحتويات
» مقتطفات

خصم 25 ٪ على كوبون الباعة المتجولين - مهندسي الاستخبارات

عند دفع النسخة الورقية من الكتاب ، يتم إرسال كتاب إلكتروني عبر البريد الإلكتروني.

Source: https://habr.com/ru/post/ar476466/


All Articles