iBrain موجود بالفعل هنا - وهو موجود بالفعل في هاتفك

عرض Apple الحصري للذكاء الاصطناعي وتعلم الآلة




30 يوليو 2014 زرع سوريا [سيري] الدماغ.

قبل ثلاث سنوات ، كانت شركة Apple أول شركة من أكبر شركات التكنولوجيا التي تستخدم مساعدًا للذكاء الاصطناعي في نظام التشغيل. أصبح Siri تكيفًا مع تطبيق تابع لجهة خارجية حصلت عليه الشركة. في نفس الوقت مع التطبيق في عام 2010 ، تم الاستحواذ على شركة المطور. كانت المراجعات الأولى للتكنولوجيا متحمسة ، ولكن في الأشهر والسنوات التالية ، بدأ المستخدمون في إزعاج عيوبها. في كثير من الأحيان ، تعرفت على الأوامر بشكل غير صحيح.

لذلك ، نقلت Apple نظام التعرف على الصوت في Siri للعمل باستخدام شبكة عصبية للمستخدمين من الولايات المتحدة في يوم يوليو المذكور أعلاه (في بقية العالم حدث هذا في 15 أغسطس 2014). ظلت بعض التقنيات السابقة قيد التشغيل - بما في ذلك "نماذج ماركوف المخفية" - ولكن النظام الآن يعتمد على تقنيات التعلم الآلي مثل الشبكات العصبية العميقة (DNNs) والشبكات العصبية التلافيفية والذاكرة قصيرة المدى طويلة المدى والشبكات المتكررة مع البوابات و n-grams. بعد الترقية ، بدت سيري متشابهة ، لكن التعلم العميق جاء لإنقاذها.

وكما هو الحال غالبًا مع التحديثات المخفية ، لم تعلن شركة Apple عن ذلك. إذا لاحظ المستخدمون ، فهذا انخفاض في عدد الأخطاء. تدعي شركة Apple أن النتائج في تحسين الدقة كانت مذهلة.


نائب الرئيس الأول لبرامج وخدمات الإنترنت ، Eddie Kew ،

"كانت هذه إحدى الأوقات التي كان فيها التحسين مهمًا للغاية لدرجة أننا اضطررنا للتحقق مرة أخرى من النتائج للتأكد من عدم وضع أي فاصل عشري في مكان آخر" ، يقول Eddie Kew. نائب الرئيس الأول لبرامج وخدمات الإنترنت.

قصة تحول سيري ، الموصوفة لأول مرة في هذا المقال ، قد تفاجئ خبراء منظمة العفو الدولية. ليس لأن الشبكات العصبية حسنت النظام ، ولكن لأن أبل قامت بكل شيء بصمت. حتى وقت قريب ، عندما زادت الشركة توظيفها لخبراء الذكاء الاصطناعي واكتسبت شركتين متخصصتين ، اعتبر المراقبون أن شركة آبل متأخرة في المنافسة الأكثر إثارة في عصرنا: السباق لاستغلال القدرات الغنية للذكاء الاصطناعي. نظرًا لأن شركة Apple كانت مترددة دائمًا في مشاركة المعلومات حول ما يحدث خلف الأبواب المغلقة ، لم يشك خبراء الذكاء الاصطناعي في أن الشركة تعمل في مجال التعلم الآلي. قال جيري كابلان ، دورة تاريخ الذكاء الاصطناعي بجامعة ستانفورد: "Apple ليست جزءًا من المجتمع". "Apple هي وكالة الأمن القومي في عالم الذكاء الاصطناعي." لكن خبراء الذكاء الاصطناعي اعتقدوا أنه إذا كانت Apple تقوم بالذكاء الاصطناعي بجدية مثل Google أو Facebook ، لكان ذلك معروفًا.

يقول أورين إتزيوني من معهد ألن للذكاء الاصطناعي: "أفضل الأشخاص على Google و Facebook و Microsoft هم ​​التعلم الآلي". - نعم ، استأجرت شركة Apple شخصًا ما. ولكن اتصل بي بأفضل خمسة خبراء في الذكاء الاصطناعي في Apple؟ لديهم التعرف على الكلام ، ولكن ليس من الواضح أين يساعدهم التعلم الآلي. أرني مكان استخدام MO في منتجك! "

يقول إتزيوني ، الذي وُلد بالفعل في إسرائيل: "أنا نفسي مع ميسوري". "أرني."

أظهرت شركة Apple مؤخرًا مكان استخدام التعلم الآلي في منتجاتها - ولكن ليس إلى Etzoni ، ولكن بالنسبة لي. قضيت معظم اليوم في غرفة اجتماعات One Infinite Loop في كوبرتينو ، تلقيت معلومات أساسية حول عمل الشركة مع AI و MO من المديرين التنفيذيين لشركة Apple (Kew ، Phil Schiller ، نائب الرئيس الأول للتسويق الدولي ، و Craig Federigi ، نائب الرئيس الأول لتطوير البرمجيات) وعالمين كان عملهما مفتاحًا لتطوير سوريا. جلسنا ، وأعطوني محتوى من صفحتين يدرجون منتجات وخدمات Apple باستخدام تقنية الماكينة - تلك التي كانت تستعد بالفعل للإصدار ، أو التي كانت تغادر بالفعل - كموضوع للنقاش.

الرسالة: نحن هنا بالفعل. نحن لسنا أدنى من أي شخص. لكننا نفعل ذلك بطريقتنا الخاصة.

إذا كنت تستخدم iPhone ، فقد واجهت AI من Apple ، وليس فقط في الإصدار المحسن من Siri. تصادفها عندما يحدد الهاتف المتصل غير الموجود في قائمة جهات الاتصال الخاصة بك (ولكن الذي كتب لك رسالة بريد إلكتروني مؤخرًا). أو عندما تقوم بتمرير إصبعك عبر الشاشة لإحضار قائمة بالتطبيقات ، ومن بينها هناك احتمال كبير أن ترغب في فتحه بعد ذلك. أو عندما تتلقى تذكير اجتماع أنك لم تضيف إلى التقويم. أو عندما تظهر نقطة على الخريطة مع الفندق الذي حجزته ، ولم تدخل بعد عنوانه. أو عندما يوجهك الهاتف إلى المكان الذي أوقفت فيه سيارتك ، لكنك لم تطلبه. ظهرت جميع هذه الميزات أو تم تحسينها بشكل كبير من خلال استخدام التعلم العميق والشبكات العصبية.


يعمل التعرف على الوجه مع الشبكات العصبية

كما يقول متحدثي ، يتم استخدام MO بالفعل في جميع منتجات وخدمات الشركة. تستخدم Apple تدريبًا متعمقًا للتعرف على المحتالين في متجر Apple ، لزيادة عمر البطارية ، لاستبعاد التعليقات الأكثر فائدة من مختبري الإصدار التجريبي. تساعد MO شركة Apple على اختيار الأخبار لك. يحدد ما إذا كان مستخدمو Apple Watch يمارسون الرياضة ، أو ببساطة يتقدمون ذهابًا وإيابًا. يتعرف على الوجوه والأماكن من الصور الفوتوغرافية. يحدد ما إذا كان من الأفضل قطع اتصال Wi-Fi الضعيف والتبديل إلى اتصالات الهاتف المحمول. حتى أنها تعرف كيف تصنع فيلمًا ، وتجمع الصور ومقاطع الفيديو في فيلم صغير بلمسة زر واحدة. يفعل منافسو الشركة نفس الشيء ، ولكن وفقًا لمديريها ، لا يمكن أن تعمل قدرات الذكاء الاصطناعي هذه تمامًا ، مع حماية خصوصية المستخدمين مثلما تفعل في Apple.وبالطبع ، لا يصنع أي منهم منتجات مثل Apple.

منظمة العفو الدولية ليست جديدة على الشركة. بالفعل في التسعينات ، استخدموا بعض تقنيات MO في البرامج التي تعرف على الكتابة اليدوية (تذكر نيوتن؟). يمكن العثور على بقايا هذه المحاولات في برامج اليوم التي تحول الأحرف الصينية المكتوبة بخط اليد إلى نص أو تتعرف على الإدخال حرفًا تلو الآخر في Apple Watch. تم تطوير هاتين الفرصتين من قبل نفس الفريق من المتخصصين في وزارة الدفاع. بالطبع ، في السابق ، كان التعلم الآلي يعمل بشكل أكثر بدائية ، وقليل من الناس يعرفون التعلم العميق. اليوم ، هذه التقنيات في ذروتها ، وأبل تشعر بالضيق ردا على الادعاءات التي تقول إن MO ليست خطيرة للغاية. وهنا يتحدث قادة الشركة عن هذا بمزيد من التفصيل.



يقول فيل شيلر: "على مدى السنوات الخمس الماضية ، كنا نلاحظ نمو هذه المنطقة في الشركة". "أصبحت أجهزتنا أكثر ذكاءً ، وهي تحدث بشكل أسرع ، خاصةً مع استخدام رقائق A-series التي طورناها. أصبحت الواجهة الخلفية أكثر ذكاءً وسرعة ، وكل شيء نقوم به متصل ببعضنا البعض." وهذا يسمح لنا باستخدام المزيد والمزيد من تقنيات MO ، لأنه يجب تعلم الكثير ، لكنها متاحة لنا بالفعل. "

وعلى الرغم من أن Apple تكافح من أجل استخدام MO إلى أقصى حد ، إلا أن المخرجين يؤكدون أن هذه العملية ليست خاصة. يرى رؤساء كوبرتين في التعلم العميق و MO مجرد تقنية أخرى من تيار من تقنيات الاختراق المتتالية. نعم ، نعم ، إنها تغير العالم ، ولكن ليس أكثر من اختراقات أخرى ، مثل شاشات اللمس أو الشاشات المسطحة أو OOP. من وجهة نظر شركة آبل ، فإن MO ليست الحدود الأخيرة ، على الرغم من رأي الشركات الأخرى. يقول كيو: "بعد كل شيء ، لا يمكن القول أنه على مدى السنوات الماضية لم تكن هناك تقنيات أخرى حاسمة لتغيير مبادئ تفاعلنا مع الأجهزة". ولا أحد في الشركة يريد الاقتراب من مناقشة الموضوعات المخيفة التي تظهر دائمًا عند ذكر الذكاء الاصطناعي. وكما تتوقع ، لا تؤكد Apple ما إذا كانت تعمل على المركبات الآلية أو نسختها من Netflix.لكن الفريق أشار بوضوح إلى أن Apple لا تعمل على Skynet.

يقول شيلر: "نستخدم هذه التقنيات لما أردنا منذ فترة طويلة القيام به ، وبجودة أفضل مما كان ممكنًا من قبل". - وللأشياء الجديدة التي لم نتمكن من القيام بها. ستصبح هذه التقنية طريقة Apple لتحقيق الأهداف أثناء تطورها داخل الشركة وبسبب الطريقة التي نصنع بها منتجاتنا ".

ولكن خلال الموجز ، أصبح من الواضح كيف غيّر الذكاء الاصطناعي إلى حد كبير طرق استخدام النظام البيئي لشركة Apple. يعتقد خبراء منظمة العفو الدولية أن Apple محدودة من حيث أنها لا تمتلك محرك بحث خاص بها (والذي يمكن أن يوفر بيانات لتدريب الشبكات العصبية) وقناعتها غير المرنة بالحاجة إلى حماية معلومات المستخدم (البيانات التي يمكن استخدامها بطريقة أخرى). ولكن اتضح أن شركة Apple قد اكتشفت بالفعل كيفية التغلب على كل من هذه العقبات.

وما حجم هذا الدماغ ، ذاكرة التخزين المؤقت الديناميكية التي توفر MO على iPhone؟ فوجئت بإجابتي على هذا السؤال. يبلغ حجمها حوالي 200 ميغابايت ، اعتمادًا على كمية المعلومات الشخصية المخزنة (يتم حذف البيانات القديمة دائمًا). يتضمن هذا معلومات حول استخدام التطبيقات ، والتفاعل مع الناس ، ومعالجة الشبكات العصبية ، وتوليد الصوت ، و "نمذجة أحداث اللغة الطبيعية". يحتوي أيضًا على البيانات المستخدمة للشبكات العصبية التي تعمل مع التعرف على الأنماط والوجوه وتصنيف المشهد.

ووفقًا لشركة Apple ، يتم كل هذا بطريقة تجعل إعداداتك وتفضيلاتك وحركاتك خاصة.

وعلى الرغم من أنهم لم يشرحوا لي كل شيء عن استخدام الذكاء الاصطناعي في الشركة ، فقد تمكنت من معرفة كيفية نشر الشركة للخبرة في MO بين موظفي المنظمة. يتم تقاسم موهبة منطقة موسكو في جميع أنحاء الشركة ، وهي متاحة لجميع المطورين الذين يتم تشجيعهم على استخدام هذه المعرفة لحل المشاكل وابتكار فرص جديدة لمنتجات معينة. يقول Craig Federigi: "ليس لدينا منظمة مخصصة ، وهي MO Temple ، في شركة Apple". "نحن نحاول إبقاء المعلومات أقرب للفرق التي تستخدمها لخلق تجربة المستخدم المناسبة."

كم عدد الأشخاص في الشركة الذين يعملون على MO؟ يقول Federigi بعد بعض التفكير: "كثيرًا". (إذا كنت تعتقد أنه سيخبرني بالمبلغ الدقيق ، فأنت لا تعرف Apple). من المثير للاهتمام أن هؤلاء الأشخاص الذين لم يكونوا خبراء في هذه المشكلة قبل الانضمام إلى الشركة يتطورون أيضًا في Apple. يقول Federigi: "نحن نوظف أشخاصًا على دراية جيدة بالرياضيات والإحصاءات والبرمجة والتشفير". - اتضح أن العديد من هذه المواهب تحولت تمامًا إلى MO. على الرغم من أننا اليوم ، بالطبع ، نوظف متخصصين في منطقة موسكو ، فإننا نأخذ أيضًا الأشخاص ذوي الميول والمواهب اللازمة ".


يستمع Craig Federigi ، نائب الرئيس الأول لتطوير البرامج ، إلى Alex Acero ، المدير الأول لـ Siri

على الرغم من أن Federigi لا يقول هذا ، إلا أن هذا النهج قد يكون ضروريًا: قد يجعل ميل الشركة إلى السرية في وضع غير موات مقارنة بالمنافسين الذين يشجعون أفضل المبرمجين على نشر نتائج البحث. يقول Federigi: "إن طرقنا تزيد من تشتت الانتقاء الطبيعي - أولئك الذين يحتاجون إلى العمل الجماعي وإطلاق المنتجات الممتازة أكثر من أي شيء آخر ضد أولئك الذين يحتاجون إلى النشر أكثر من غيرها". إذا حقق الباحثون تقدمًا كبيرًا في هذا المجال أثناء تحسين منتجات Apple ، فهذا أمر جيد. يقول كيو: "لكن بالنسبة لنا ، ستكون النتيجة النهائية هي الشيء الرئيسي".

يدخل بعض الأشخاص الموهوبين إلى الشركة بعد الاستحواذ. يقول كيو: "في الآونة الأخيرة ، كنا نشتري 20-30 شركة صغيرة سنويًا ، ونحن منخرطون في توظيف العمالة". عندما تشتري Apple شركة تعمل في مجال الذكاء الاصطناعي ، فإنها لا تفعل ذلك لأن "هناك حشد من الباحثين في MO هنا ، دعنا نخرج منها" ، يقول Federigi. "نحن نبحث عن أشخاص موهوبين ولكنهم يركزون على خلق تجربة مستخدم رائعة."

آخر عملية استحواذ هي شركة Turi ، وهي شركة مقرها في سياتل اشترتها شركة Apple مقابل 200 مليون دولار. لقد قاموا ببناء مجموعة أدوات للمشاركين مماثلة لـ TensorFlow من Google ، وأدى هذا الاستحواذ إلى شائعات بأن Apple ستستخدم هذه التقنية لأغراض مماثلة ، سواء لنفسها أو للمطورين. المدراء لا يؤكدون أو يرفضون هذه المعلومات. يقول كيو: "لقد تم دمج بعض نتائجها بشكل جيد للغاية مع Apple ، سواء من حيث التكنولوجيا أو من حيث الأفراد". في غضون عامين ، ربما سنكتشف ما حدث ، كما حدث عندما بدأ Siri في إظهار القدرات التنبؤية لـ Cue (غير المتعلقة بـ Eddie) ، وهو منتج بدء التشغيل الذي يحمل نفس الاسم الذي اشترته Apple في عام 2013.

بغض النظر عن المكان الذي تأتي منه الموهبة ، فإن البنية التحتية للذكاء الاصطناعي من Apple تسمح لها بتطوير منتجات وقدرات غير ممكنة بخلاف ذلك. إنها تغير برنامج تطوير منتجات الشركة. يقول شيلر: "ليس هناك نهاية لقائمة أبل من الأفكار الرائعة". - MO يسمح لنا بالتحول إلى مثل هذه الأشياء التي لم نلمسها في الماضي. يندمج في عملية صنع القرار حول المنتجات التي سنتعامل معها في المستقبل ".

أحد الأمثلة هو Apple Pencil ، الذي يعمل مع Apple Pencil. لجعل هذا القلم عالي التقنية يعمل ، كان على الشركة حل المشكلة - عندما يكتب الناس على الشاشة ، يتم تشغيل الجزء السفلي من راحة اليد على شاشة اللمس ، مما يؤدي إلى ظهور نقرات زائفة. باستخدام نموذج MO للقضاء على هذه الصنابير ، تمكنت الشركة من تعليم الشاشة للتمييز بين التمرير واللمس والإدخال من القلم. يقول Federigi: "إذا لم ينجح هذا بنسبة 100٪ ، فإن ورقة التسجيل هذه ليست مناسبة لي ، وقلم الرصاص منتج سيئ". إذا كنت تحب Pencil ، فأشكر MO على ذلك.

ربما يكون أفضل مقياس لتقدم MO في الشركة هو عملية الشراء الأكثر أهمية ، Siri. نشأت في برنامج DARPA الطموح لتطوير مساعدين أذكياء ، وبعد ذلك أسس العديد من العلماء الشركة لإنشاء تطبيق باستخدام هذه التكنولوجيا. أقنع ستيف جوبز شخصيًا مؤسسي الشركة ببيع Apple في عام 2010 ، وأصر على دمج Siri في نظام التشغيل. كان إطلاقه أحد أبرز مميزات عرض iPhone 4S في أكتوبر 2011. الآن لا يعمل فقط عندما يضغط المستخدم على زر الصفحة الرئيسية أو تمتمس "Hey Siri" (يستخدم MO أيضًا هذه الميزة ، مما يسمح لـ iPhone بالاستماع الأثير ، عدم وضع الكثير من البطارية). تم دمج ذكاء Siri في Apple Brain ، ويعمل حتى عندما لا يقول شيئًا.

يصف Kew المكونات الأربعة للمنتج الأساسي: التعرف على الكلام وفهم اللغة الطبيعية وتنفيذ الأوامر والاستدعاء. ويقول: "أثرت وزارة التربية والتعليم على جميع هذه المناطق بقوة شديدة".


رئيس الهندسة المتقدمة Tom Gruber و Siri Guru ، Alex Acero

يعمل Siri في رئيس قسم التطوير المتقدم Tom Grubber ، الذي وصل إلى Apple جنبًا إلى جنب مع الاستحواذ الرئيسي (غادر المؤسسون للشركة Apple في 2011). يقول إنه حتى قبل تطبيق الشبكات العصبية على Siri ، فقد تلقوا كمية كبيرة من البيانات الواردة من قاعدة المستخدمين. في المستقبل ، كانت هذه البيانات بمثابة مفتاح لتدريب الشبكات العصبية. "قال ستيف أننا سننتقل من تطبيق تجريبي إلى مئات الملايين من الأشخاص في ليلة واحدة ، بدون اختبار تجريبي" ، كما يقول. - فجأة سيكون لدينا مستخدمين. تم إخبارنا بكيفية استدعاء الأشخاص للأشياء المتعلقة بطلبنا. كانت هذه الثورة الأولى. ثم ظهرت الشبكات العصبية ".

تزامن انتقال سيري إلى الشبكات العصبية التي تعالج التعرف على الكلام مع وصول العديد من خبراء الذكاء الاصطناعي ، بما في ذلك أليكس أسيرو ، الذي أصبح الآن رئيس فريق تقنية الكلام. بدأ Acero مسيرته المهنية في التعرف على الكلام في Apple في أوائل التسعينات ، ثم أمضى سنوات عديدة في Microsoft Research. يقول: "لقد أحببت العمل هناك حقًا ، لقد نشرت الكثير من العمل". "ولكن عندما خرج سيري ، قلت:" هذه فرصة لجعل الشبكات العصبية العميقة حقيقة واقعة ، لنقلها من حالة يقرأها مائة شخص عنها ، إلى حالة يستخدمها الملايين. " وبعبارة أخرى ، كان ينتمي تمامًا إلى نوع العلماء الذين كانت شركة Apple تبحث عنه - وهو وضع المنتج فوق المنشورات.

عندما انضمت Acero إلى الشركة قبل ثلاث سنوات ، كانت Apple لا تزال بصدد الحصول على تراخيص لمعظم تقنيات الكلام في Siri من الشركات المصنعة الخارجية ، وكان هذا الوضع سيتغير قريبًا. يلاحظ Federigi أن Apple تعمل باستمرار على هذا النمط. عندما يصبح من الواضح أن المجال التكنولوجي ضروري لقدرتنا على إطلاق منتج جديد بمرور الوقت ، فإننا نزيد من قدرتنا الداخلية على إنتاج ما نريد. لجعل منتج رائع ، نحتاج إلى أن نتقن تماما في التكنولوجيا والابتكار داخليا. يعد الكلام مثالًا رائعًا على كيفية استخدامنا للفرص المتاحة من الخارج لإعطاء المشروع بداية ".

بدأ الفريق بتدريب الشبكة العصبية لتحل محل سيري الأصلي. يقول Acero: "كان لدينا أروع مزرعة GPU ، تعمل على مدار الساعة". "وقد دفعنا مجموعة من البيانات إلى ذلك." أثبت إصدار يوليو 2014 أن كل وقت المعالج هذا لم يضيع.

يقول Acero: "لقد انخفض عدد الأخطاء إلى النصف بجميع اللغات ، وفي بعض الحالات أكثر من ذلك". "في الغالب بفضل التعلم العميق وتحسيننا - ليس فقط الخوارزمية نفسها ، ولكن وفقًا لسياق عملها في المنتج النهائي."

ذكر المنتج النهائي ليس من قبيل الصدفة. Apple ليست أول من استخدم تدريب الشبكات العصبية العميقة في التعرف على الكلام. لكن Apple تدعي أنها تتمتع بميزة التحكم في تطوير المنتج بالكامل ونظام التسليم. نظرًا لأن Apple تقوم بالرقائق بنفسها ، فقد أتيحت الفرصة لشركة Acero للعمل مع فريق التطوير والمهندسين الذين كتبوا البرامج الثابتة للأجهزة لزيادة أداء الشبكات العصبية إلى أقصى حد. حتى أن احتياجات فريق تطوير Siri أثرت في تصميم iPhone.

يضيف فيديريجي: "إنه ليس مجرد السيليكون". - عدد الميكروفونات الموجودة بالجهاز حيث توجد. كيف نقوم بإعداد الأجهزة والميكروفونات ومجموعة من البرامج التي تعالج الصوت. تفاعل الأجزاء مهم. هذه ميزة كبيرة على أولئك الذين كتبوا برامج ببساطة ورأوا ما يفعله. "

ميزة أخرى: عندما تعمل الشبكة العصبية في منتج واحد ، يمكن تكييفها كأساس للتكنولوجيا لأغراض أخرى. MO ، يساعد Siri على فهمك ، يتحول إلى محرك لتسجيل الإملاء. نتيجة لعمل Siri ، يجد الأشخاص أن رسائل البريد الإلكتروني والرسائل الخاصة بهم ستكون ذات معنى أكثر إذا تركوا لوحة المفاتيح على الشاشة ، وانقر فوق رمز الميكروفون وتحدث بصوت عالٍ.

العنصر الثاني من سيري ، الذي ذكره كيو ، هو فهم اللغة الطبيعية. بدأ Siri في استخدام MO لفهم نوايا المستخدم في نوفمبر 2014 ، وأصدر نسخة تعلمية عميقة بعد ذلك بعام. وكما هو الحال مع التعرف على الكلام ، حسّنت MO تجربة المستخدم - خاصةً من حيث التفسير الأكثر مرونة للأوامر. على سبيل المثال ، يأخذ Kew جهاز iPhone ويستدعي Siri. يقول: "أرسل جين عشرين دولارًا عبر Square Cash". تظهر رسالة على الشاشة مع وصف لطلبه. ثم يحاول تعيين المهمة بطريقة مختلفة: "ارمي عشرين من زوجتي". والنتيجة هي نفسها.

تدعي Apple أنه بدون هذه التحسينات في Siri ، سيكون من غير المحتمل أن يكون الإصدار الحالي من Apple TV ، الذي يتميز بالتحكم الصوتي المعقد ، ممكنًا. جعلتك الإصدارات السابقة من Siri تتحدث بوضوح وبشكل منفصل ، فإن إصدار MO المشحون لا يوفر فقط خيارات محددة من كتالوج ضخم من الأفلام والأغاني ، ولكنه يفهم أيضًا المفاهيم. "أرني فيلمًا جيدًا مع توم هانكس." (إذا كانت سيري ذكية حقًا ، لكانت قد استبعدت كود دافنشي). يقول Federigi: "لم يكن من الممكن توفير مثل هذه الفرصة قبل ظهور هذه التكنولوجيا".

من المقرر إطلاق IOS 10 هذا الخريف ، وسيكون صوت Siri هو آخر مكون من أربعة مكونات تم تحويلها بواسطة MO. استبدلت الشبكات العصبية العميقة التطبيقات السابقة التي تم إجراؤها بموجب ترخيص. في الواقع ، يتم اختيار النسخ المتماثلة لـ Siri من قاعدة بيانات السجلات التي تم جمعها في مركز الصوت ويتم تجميع كل جملة في أجزاء. وفقًا لـ Grubber ، فإن التعلم الآلي ينعم الزوايا ويجعل Siri يبدو وكأنه شخص حقيقي.

يقوم Acero بمظاهرة - أولاً صوت Siri المألوف ، مع ملاحظات تشبه الروبوتات اعتدنا عليها. ثم واحدة جديدة ، تقول "مرحبًا ، كيف يمكنني مساعدتك؟" ، بسلاسة آسرة. ما الفرق؟ "التعلم العميق ، حبيبي" ، يقول.

يبدو الأمر وكأنه تفاصيل دقيقة ، لكن الصوت الأكثر طبيعية يمكن أن يؤدي إلى تغييرات كبيرة. يقول غروبر: "يثق الناس بصوت أفضل بشكل أفضل". - أفضل صوت يجذب المستخدم ويشجعه على استخدامه مرات أكثر. تأثير العودة في ازدياد ".

أصبحت الرغبة في استخدام Siri ، وكل التحسينات التي تم إجراؤها بفضل MO ، أكثر أهمية ، لأن Apple أخيراً فتحت Siri لمطوري الجهات الخارجية - ويعتقد منتقدو الشركة أن الوقت قد حان للقيام بذلك منذ وقت طويل. لاحظ الكثير أن شركة Apple ، التي يتخلف عشرات من شركاء Siri عنها ، مثل أنظمة Alexa من Amazon ، تفتخر بآلاف الميزات التي يوفرها مطورو الجهات الخارجية. تقول Apple أن مقارنتها غير صحيحة لأنه يجب على مستخدمي Amazon التعبير عن رغباتهم بلغة خاصة. سيري سيري بشكل طبيعي أشياء مثل SquareCash أو Uber. (يعد منافس آخر ، Viv - تم إنشاؤه من قبل مؤسسي Siri الآخرين - بالتكامل مع خدمات الطرف الثالث عندما لا يتم الإعلان عن تاريخ الإصدار بعد).

ربما يكون التحدي الأكبر لتطوير MO هو النجاح ، إذا لزم الأمر ، في الالتزام بمبادئ خصوصية المستخدم. تقوم الشركة بتشفير بياناتهم ، لذلك لا يمكن لأي شخص ، حتى محامو Apple ، قراءتها (حتى مكتب التحقيقات الفدرالي ، حتى مع وجود مذكرة). وتفخر الشركة بعدم جمع بيانات المستخدم لأغراض الدعاية.

على الرغم من أن مثل هذا التقشف جدير بالثناء من وجهة نظر المستخدمين ، إلا أنه لا يساعد على جذب أفضل مواهب الذكاء الاصطناعي في الشركة. قال موظف سابق في Apple يعمل في شركة متخصصة في الذكاء الاصطناعي: "يحتاج الخبراء في MO إلى بيانات". "ولكن في وضع الخصوصية ، تجبرك شركة Apple على العمل بيد واحدة ملزمة." يمكنك القول ما إذا كان هذا صحيحًا أم خاطئًا ، ولكن نتيجة لذلك ، لا تتمتع Apple بسمعة خبراء الذكاء الاصطناعي الرائعين حقًا ".

هناك مشكلتان. الأول هو معالجة المعلومات الشخصية في الأنظمة القائمة على MO. عندما تمر البيانات الشخصية للمستخدم من خلال حجر الزاوية لمعالجة الشبكة العصبية ، ماذا يحدث لهذه المعلومات؟ تتضمن المشكلة الثانية جمع المعلومات اللازمة لتدريب الشبكات العصبية على التعرف على السلوك. كيف يمكن القيام بذلك دون جمع معلومات المستخدم الشخصية؟

تعتقد Apple أن لديها حلولاً. يقول كيو: "يعتقد بعض الأشخاص أنه لا يمكننا فعل ذلك بالذكاء الاصطناعي لأنه ليس لدينا بيانات". "ولكننا وجدنا طرقًا للحصول على البيانات التي نحتاجها ، مع الحفاظ على الخصوصية". هكذا. "

تحل Apple المشكلة الأولى من خلال الاستفادة من القدرة على التحكم في كل من البرامج والأجهزة. تبقى أكثر المعلومات الشخصية داخل Apple Brain. يقول Federigi: "نقوم بتخزين الأشياء الأكثر حساسية حيث تحدث MO بشكل محلي فيما يتعلق بالجهاز". كمثال ، أعطى تنبؤات للتطبيقات لتشغيل ، الرموز التي تظهر عند تمرير الشاشة إلى اليمين. تستند هذه التوقعات إلى عوامل عديدة ، يعتمد بعضها على سلوكك فقط. ويعملون - يقول Federigi أن 90٪ من الوقت يجد الناس ما يحتاجون إليه في هذه التوقعات. جميع الحسابات التي تجريها Apple مباشرة على الهاتف.

بالإضافة إلى ذلك ، يخزن الجهاز ، ربما ، أكثر المعلومات الشخصية التي تلقتها الشركة: الكلمات التي يستخدمها الأشخاص على لوحة مفاتيح iPhone QuickType. باستخدام نظام تدريب الشبكة العصبية الذي يراقب إدخالاتك ، يمكن لـ Apple التعرف على الأحداث واللحظات الرئيسية ، مثل المعلومات حول السفر الجوي وجهات الاتصال والاجتماعات - ولكن تبقى المعلومات نفسها على هاتفك. حتى في النسخ الاحتياطية المخزنة في السحابة ، يتم تخفيفها بطريقة لا يمكنك الحصول عليها من نسخة احتياطية واحدة فقط. يقول Federigi: "لا نريد تخزين هذه المعلومات على خوادمنا". "لا تحتاج Apple إلى معرفة عاداتك ، أو أين ومتى تذهب."

تحاول Apple تقليل المعلومات المخزنة. أعطى Federigi مثالًا يمكنك فيه إجراء محادثة ، وسيذكر أحد الأشخاص فيها مصطلحًا مناسبًا للبحث. يمكن للشركات الأخرى تحليل المحادثة بأكملها في السحابة للعثور على هذه المصطلحات ، ولكن يمكن لجهاز Apple التعرف عليها حتى لا تترك البيانات المستخدم - لأن النظام يبحث باستمرار عن تطابقات في قاعدة المعرفة المخزنة على الهاتف (وهو جزء من 200 ميجابايت "الدماغ").

"القاعدة مضغوطة ، لكنها شاملة ، مع مئات الآلاف من المواقع والأشياء. يقول Federigi ، نقوم بتوطينها ، لأننا نعرف مكانك. تصل جميع تطبيقات Apple إلى قاعدة البيانات ، بما في ذلك Spotlight والخرائط ومحرك بحث Safari. يساعد على تصحيح الأخطاء تلقائيًا. "ويعمل باستمرار في الخلفية ،" يقول.

بدءًا من iOS 10 ، ستستخدم Apple التكنولوجيا الجديدة للخصوصية المتباينة ، والتي تسمح بمعلومات التعهيد الجماعي بحيث لا يمكنها التعرف على الأفراد. قد تكون هذه الكلمات قد اكتسبت شعبية غير موجودة في قاعدة البيانات ، أو الروابط التي تقدم إجابات أكثر صلة بالاستعلامات ، أو طريقة لاستخدام رموز تعبيرية معينة. يقول Federigi: "عادةً ما يكون من المعتاد في الصناعة إرسال جميع الكلمات والرموز التي تدخلها إلى خوادم الشركة حتى يتمكنوا من الخوض فيها لاحقًا ويلاحظون شيئًا مثيرًا للاهتمام". "نحن نقوم بتشفير المعلومات من وإلى ، لذلك لا نقوم بذلك." على الرغم من أن الخصوصية المتميزة نشأت في مجتمع البحث ، تحاول Apple تقديمها إلى الجماهير. "نحن ننقلها من قسم الأبحاث إلى مليار مستخدم ،" يقول Kew.

وعلى الرغم من أنه من الواضح أن MO قد غيرت منتجات Apple ، إلا أنه لم يتضح بعد ما إذا كانت قد غيرت الشركة نفسها. بمعنى ما ، فإن النهج الذي يتبعه MO يتعارض مع روح الشركة. تراقب Apple بعناية تجربة المستخدم ، وصولاً إلى المستشعرات التي تقيس الموصلية على الشاشة. كل شيء مخطط مسبقًا ومشفّر بدقة. ولكن عند استخدام MO ، يجب على المهندسين أن يتراجعوا ويتيحوا للبرنامج الفرصة للبحث عن حلول بأنفسهم. هل يمكن لشركة Apple التكيف مع الواقع الحديث ، حيث يمكن للأنظمة التي تستخدم MO أن تشارك في تصميم المنتج؟

يقول فيديريجي: "هذا هو سبب الكثير من الجدل في الشركة". - نحن معتادون على تقديم تجربة مدروسة ومضبوطة للغاية نتحكم فيها بجميع أبعاد كيفية اتصال النظام مع المستخدم. عندما تبدأ في تدريب نظام قائم على مجموعة كبيرة من البيانات حول السلوك البشري ، قد لا تتوافق النتائج التي تم الحصول عليها مع فكرة المصمم. تظهر على أساس البيانات ".

لكن شركة Schiller تقول إن شركة Apple لن تتراجع. "على الرغم من أن هذه التقنيات ، بالطبع ، تؤثر على تطوير المنتجات ، إلا أننا في النهاية نستخدمها لإنتاج منتجات أفضل."

نتيجة لذلك ، لا يجوز لشركة Apple إصدار إعلانات عناوين حول الانغماس في العناصر العضوية ، ولكنها ستستخدم أكبر عدد ممكن من العناصر العضوية لتحسين المنتجات. الدماغ في هاتفك يثبت ذلك.

يقول شيلر: "سيشهد المستخدم العادي تعلمًا عميقًا بشكل يومي ، وهذا يوضح ما يعجبك في منتجات Apple". "أروع اللحظات خفية لدرجة أنك لا تفكر فيها إلا بعد لقاء ثالث معهم ، ثم تتوقف وتتسائل ،" كيف هذا ممكن؟ "

ستنتظر Skynet.

Source: https://habr.com/ru/post/ar397331/


All Articles