للسنة الثانية ، قمنا (DZ Systems) بتصوير سلسلة من برامج التحول الرقمي. عادة ما تكون هذه البرامج "ذات صلة بالأعمال" ، والتي تستهدف بشكل رئيسي كبار المديرين ومصممة للمساعدة في فهم قيمة الأعمال لما يسمى التحول الرقمي.
ولكن هذا العام ، نقوم أيضًا بتصوير "الخط" الثاني من البرامج - DZ Online Tech ، الذي يركز الآن بالفعل على الجوانب التكنولوجية لنفس الموضوع. باختصار - هذا هو "تحت الغطاء".
فيما يلي نص لمثل هذا الإرسال الذي يتحدث فيه أنا وإيفان يامشيكوف (ياندكس ، ABBYY ، ومحترف من الدرجة العالية بشكل عام) عن استخدام الشبكات العصبية في العالم الحديث.
إذا
كنت مهتمًا ،
يمكنك مشاهدة البرنامج نفسه .
ولأولئك الذين يحبون القراءة - نص أدناه:
- مرحبًا. ضيفنا اليوم هو إيفان يامشيكوف من ABBYY
سيخبرنا كيف يعمل الذكاء الاصطناعي الحديث.
فيما يتعلق بالذكاء الاصطناعي ، هناك موقفان مشروطان: الأشخاص الذين يقولون: "نحن لا نريد
لا تفهم شيئًا عن جوهر ما يحدث في النظام. لدينا طرق إحصائية ،
الذين سيأخذون النموذج من الحياة الخارجية. هذا النموذج سيكون صحيحا
اشعر بكل الخفايا الدلالية. " وهناك أناس يقولون ، "لا ، هذا
غير مسموح. نحن نفهم ما يحدث. يجب أن نضع هذا الفهم في النظام.
الذكاء الاصطناعي ، وبعد ذلك سيكون أكثر قيمة وأفضل وأفضل ". هذه المعركة
هل لديها أي معايير؟"دعني أشرح بلغة أقل فلسفية." هناك أناس يقولون: "نحن بحاجة إلى المزيد
خوارزميات أقوى وأكثر قوة وبيانات أكثر. سنأخذ المزيد
خوارزمية منتجة ، وسوف تعطينا جودة هدف أكبر على حجم أكبر
المقاييس ، مهما كانت. " لا أعرف أشخاصًا يقولون أنهم لا يحتاجون إلى بيانات أو
الخوارزميات لذلك ، فإن المجموعة الثانية من الناس ، في رأيي ، لديها النهج التالي: "بالإضافة إلى
من كل هذا ، سيكون من الجيد بالنسبة لنا أن نمتلك علامات بشرية بشكل أو بآخر ، نوع ما
المعرفة الخبيرة ، أضف على القمة ".
هناك نكتة على Google غالبًا ما يتم اقتباسها: يعمل اللغويون الأقل
المنتج ، كلما كانت الجودة النهائية أفضل. هذه النكتة ربما تبررها الممارسة.
خدمات B2C الشامل. ولكن عندما نتحدث عن B2B في سياق البقالة الضيقة
الحلول ، في سياق مهمة محددة بوضوح ومجال محدد جيدًا ، إذن
تبدأ معرفة الخبراء بلعب دور مهم إلى حد ما. نجمع داخل ABBYY و
النماذج الوجودية التي يبنيها اللغويون ونُهج التعلم الآلي البحت.
- أريد أن أعطي مثالاً: لقد قمنا بمشروع لـ Mosvodokanal. كانت هناك مثل هذه المهمة:
Mosvodokanal شبكة معقدة ، تعمل بطريقة أو بأخرى وتتصرف بطريقة أو بأخرى. وأريد شيئا
ثم لفهم الأمر ، من المستحسن التنبؤ بالحوادث ، والشعور عندما يكون هناك خطأ ما
مستمرة.- قمت بعمل نظام مراقبة.
- نعم ، قمنا بعمل نوع من نظام تحليل السلوك ، والذي كان من المفترض أن يقول: "في هذا
هناك خطأ ما في الزاوية. " لا يمكننا أن نقول ما إذا كان هذا حادثًا أم مجرد تقلب.
السلوكيات لأنها لا يمكن تمييزها جسديًا ...- قمت بعمل نفس النظام لمراقبة حركة المرور.
- موضوع مشابه جدا. خلال المشروع ، قاتلنا مع المهندسين الذين قالوا:
"اسمع ، أنت تفعل القمامة. من الضروري قياس جميع الأنابيب وأقطارها خارجية و
داخليًا ، ثم أدخل معلومات حول نعومة الجدران. ثم عد
النموذج الهيدروديناميكي ، وستظهر كل شيء ". وقلنا: "لا.
أعطنا البيانات من المستشعرات ، وسندفعها إلى النموذج الأساسي ، وهي لا تعرف شيئًا عنها
الفيزياء ، ستعمل على أي حال ، لأنها ستزيل السلوك الحقيقي ". إنه مستقيم
الحالة النهائية لما نتحدث عنه. من ناحية ، هذه المعرفة النهائية.
فيزياء عمل الظاهرة التي نحزمها دلالة مباشرة ، والثانية
الجانب هو سوء الفهم النهائي. نحن لا نفهم كيف يعمل
الديناميكا المائية - لم نرغب حتى في فهم ذلك.- الغطرسة من سمات الأشخاص الذين يعرفون الإحصائيات جيدًا. كما قال مارك
توين: "هناك ثلاثة أنواع من الأكاذيب - الأكاذيب والأكاذيب المخزية والإحصاءات."
- انتهى الأمر بهزيمتهم لسبب واحد بسيط للغاية: جمع معلومات عن الجميع
هذه الأنابيب مستحيلة. ولكن ، من ناحية أخرى ، بعض عمق المعرفة بالموضوع
المنطقة لا يمكن أن تساعد ولكن.- الناس الذين هم وسيلة هذه المعرفة يعتقدون أنها صحيحة ، لأنها كذلك
مجال خبرتهم. لكن في نفس الوقت ، في الواقع ، نحن نفهم اللغة الطبيعية
علوم الكمبيوتر ، أقل بكثير مما نود ، لأن الكثير
لم يتم تعريف المصطلحات والفئات رياضيا ، ولكن بشكل حدسي. هذا يؤدي إلى حقيقة ذلك
هؤلاء الناس الذين يأتون بالكامل من جانب علوم الكمبيوتر ، هناك مفهوم
عدم الثقة بالأشخاص الذين يأتون من جانب اللغويات والعكس بالعكس. في ABBYY هو كذلك
قررت أن كلاهما يعمل على المنتج ، وهما مسؤولان عن الأجزاء المختلفة ، وأنت
من الممكن قياس مدى جودة هذا وذاك. هذه هي الطريقة
الاختبارات والتجارب.
- هذه أيضا مشكلة كبيرة. نعلم جميعًا أن هناك مشكلة في التحسين المحلي.- بالطبع. هذا هو إعادة التدريب. ولكن في كثير من الأحيان الأشياء المتعلقة المشتركة
تسمح لك المناهج اللغوية بالتعامل مع إعادة التدريب. لأن اللغويين غالبًا ما يحاولون إنشاء بعض القواعد العامة ، ثم هناك قصة رائعة ورائعة
حول الاستثناءات. كل من قرأ كتاب روزنتال عن اللغة الروسية في المدرسة في حيرة:
يا إلهي ، ماذا يفعل علماء اللغة؟ يسمونه القواعد في الواقع
هو ...
- مجموعة من الاستثناءات.- ولكن في الجوهر ، هذه هي نفس القصة بالضبط حول الخطأ في الاختبار. إذا نظرت إليها
وجهة نظر التعلم الآلي ، عدد كبير جدا من القواعد اللغوية
تغطية عدد كبير من الأمثلة وترك بعض الأخطاء قيد التشغيل
بيانات الاختبار. إذا كنت تأخذ هذه القواعد وتطبق على البيانات التي نموذجك
لم أر قط ، النموذج في هذا المكان خاطئ. لكن العديد من الاستدلالات اللغوية
تسمح لك بحماية نفسك من إعادة التدريب.
- سمعتك بشكل صحيح أنه إذا أخذنا كتابًا عن اللغة الروسية ودفعناه
في النموذج ، إذن ، باستقراء هذه القواعد ، هل النموذج خاطئ بالضرورة؟- بالطبع. هذا صحيح. أي قواعد صارمة ستؤدي دائمًا إلى الأخطاء ، لأنه
لسوء الحظ أو لحسن الحظ ، فإن الذكاء الاصطناعي أكثر مرونة من مجموعة معينة
قواعد بسيطة.
- هذا يرجع أيضًا إلى حقيقة أنه عندما نتحدث عن إضفاء الطابع الرسمي على القواعد الطبيعية
اللغة ، نحن في هذا المكان حتمًا منخرطون في مهمة غير قابلة للحل. عمق هذا
العملية لا حصر لها.- هذا سؤال فلسفي. على مستوى الماكينة ، لا يبدو العمق غير محدود ، ولكن هناك
مقال مثير للاهتمام ، في رأيي ، 2015. رحلة وجيزة: هناك مثل هذا القسم من الرياضيات ،
وهو ما يسمى نظرية المعلومات. على وجه الخصوص ، يتم استخدامه في نظرية الترميز.
في روسيا ، صنعه كولموغوروف وشركاؤه ، في الولايات المتحدة الأمريكية - بواسطة شانون. بادئ ذي بدء
اخترع في سياق التشفير.
في نظرية المعلومات يوجد شيء مثل "معلومات عامة". إذا تماما على الأصابع
قل: تخيل كيف ترتبط معاني كلمة في نص
اعتمادًا على المسافة بينهما. تخيل مثل هذا المقياس. إذا كان لدي هنا
تقول "بيتيا" ، ثم كلمات ن ، ثم كلمة "أكل". في الحقيقة ، الكلمتان "أكل" و "بيتيا"
ترتبط ، على الرغم من حقيقة أن كلمة "تؤكل" يمكن أن تكون بعيدة تمامًا عن "Petit".
إذا قمنا ببناء نموذج إحصائيًا لهذه الارتباطات ، فقد اتضح ذلك كدالة لـ
المسافات ، هذه المعلومات العامة في النصوص تتناقص ببطء - ليس كثير الحدود ، ولكن
أبطأ. تحدث تقريبًا ، في نصوص اللغة الطبيعية هناك ارتباط بين الكلمات ،
متباعدة.
لوحظ نفس الشيء في "نصوص" الحمض النووي: ترتبط نيوكليوتيداتنا أيضًا
مسافة كبيرة نسبيا. على وجه الخصوص ، يحاول هذا النوع من النظام أن يصف
نظرية التعقيد ، إلخ. القصة الكاملة عن تأثير الفراشة - حولها ، أن لديك القليل
يمكن أن يؤدي الانحراف في مكان واحد إلى بعض التغييرات الهامة حتى الآن.
يتم وصف اللغة الطبيعية من خلال تبعيات من هذا النوع. الآن ، دعنا نقول LSTM (طويل
تعتبر شبكة الذاكرة قصيرة المدى) الأكثر تقدمًا ، من حيث الذاكرة والعصبية
شبكة تُستخدم لتحليل اللغة لمجرد تكوين صداقات بعيدة المدى
لالتقاط الارتباطات من صديق. هنا ، العدوى ، تنخفض الذاكرة بشكل أسرع من اللازم.
هذا موضوع كبير للبحث. على وجه الخصوص ، نحن في معهد ماكس بلانك نحاول
للقيام به. هناك نتيجة مثيرة للاهتمام من نظرية الرسم البياني ، والتي تقول أنه إذا كان لديك دورات في شبكتك ، فيجب أن يكون لديها المزيد من الذاكرة. نحن نعلم أنه يوجد في دماغنا بعض
هذه ترددات مميزة ، وهناك دورات في الدماغ. إشارة تمتد على طولها ، تحفز الخلايا العصبية
بعضهم البعض في دائرة بتردد معين. في الشبكات العصبية الاصطناعية ، ما زلنا
لا يمكن التكاثر.
"لماذا لا نستطيع؟" أضف حلقات! يرجى ملء الدورات من الحقيبة."وسأخبركم." كيف نتعلم الشبكات العصبية؟ باستخدام الانتشار العكسي
الأخطاء. الانتشار الخلفي للخطأ هو عندما يكون لديك ممر عصبي مباشر
الشبكة والعكس.
- بمجرد أن تكون هناك دورات ، ابدأ فورًا بمشاكل في حلقات التكرار جدًا
الأخطاء؟- نعم! ماذا تفعل كيف نعيد الانتشار؟
الأصدقاء ، قم بالانتشار مرة أخرى في الدورة وستحقق اختراقة قوية في التنمية
الذكاء الاصطناعي. أقول للجميع: نحن بحاجة للقيام بذلك ، إنه رائع جدًا. إنه حقيقي
مهمة صعبة.
- وإذا اكتشف هؤلاء الأشخاص الذين يتعاملون مع الدماغ كيف يعمل في الدماغ ، فهو كذلك
هل يمكن وضعها؟ يبدو أن مجسم ما نقوم به اليوم هو
منخفض جدا.- هيا: ما هو المشترك بين ImageNet من جوجل والبطلينوس؟ اتضح أكثر أو أقل
هذا كل شئ. في البداية ، تم تفكيك الرخويات ورأى أن حقولها البصرية مرتبة
شبكات الالتفاف الحديثة ، إذا أردت. ذات مرة في 50s روزنبلات ورفاقه
تفكيكها ، وتوصل إلى تصور ، ينظر إلى حد كبير في أشياء حية وبسيطة للغاية. إنهم كذلك
يعتقد أننا سوف نفهم الآن كيف تعمل الكائنات البدائية ، وبعد ذلك سنبدأ في البناء
معقد.
- لماذا لم ينجحوا؟ في تلك الأيام ، كان يعتقد أن الإكسبترون لم يكن على قيد الحياة.
لا توجد قوة كافية؟- كان هناك الكثير من المشاكل. هيا: كان هناك العديد من فصول الشتاء ، أي الناس في كل مرة
توصل إلى بعض التقدم الجديد في مجال الذكاء الاصطناعي ، وفكر: "هذا كل شيء ،
سيكون جارفيس أفضل أصدقائي غدًا وسيتواصل معي بشكل أفضل مني
محلل نفسي ". ثم يحدث شيء ما ، مثل نفس جارفيس. انا احب هذه النكتة كثيرا
من فيلم "الرجل الحديدي" ، حيث يسير كل شيء على ما يرام في البداية ، ثم نطق البعض
بعض التوت البري. لذا يخبر جارفيس الشخصية الرئيسية عندما يسأله إذا قام بالتصحيح
جميع الأنظمة.
- كيف تبدو عمليا؟ أين هي القيود ، إذا كنت تأخذ التطبيق
الجانب؟- أولاً ، الآن حتى أقوى الأشياء التي نجمعها بشكل مصطنع ، بقوة
أصغر من دماغنا ببساطة من حيث الحجم.
والنقطة الثانية تتعلق بحقيقة أننا لا نفهم سبب عملهم. إنه منفصل
مجال بحث كبير.
- يبدو أنهم بدأوا بالفعل في معرفة ذلك.- أولاً اكتشفوا ما يعمل ، ثم بدأوا في معرفة كيف يعمل.
هناك اتجاه منفصل حول كيفية تصور عمل الشبكة العصبية. هناك منفصل
شكلي رياضي يسمى تحلل المعلومات ، والذي يحاول الوصف
كيف يتم تحليل المعلومات في تيارات مختلفة داخل الشبكة لفهم ما
ما الطبقات التي تحدث. مع الصور ، يبدأ في الظهور ويظهر الأخير
بضع سنوات. مع النصوص تزداد صعوبة.
لماذا لا نفهم كيف يعمل؟ لأن ليس لدينا الرياضيات الجيدة
نتيجة من شأنها أن تشرح لنا كل شيء. ليس لدينا نظرية مثبتة يمكن أن تقول
أنه يعمل. لأنه ، على سبيل المثال ، على مستوى الشبكة العصبية التلافيفية: هل لديك
صورة ، يرسم كلب عليها. هناك الكثير من البكسل في هذه الصورة ، كل منها
بكسل هناك العديد من القيم. إذا حاولت بشكل جماعي حساب الكمية
خيارات لمزيج من وحدات البكسل التي لا تزال تضيف كلبًا - تشعر بالتعب. في
من المفترض أن يكون لديك مساحة أبعاد كبيرة إلى حد ما والعديد من الخيارات
القرارات. علاوة على ذلك ، إذا بدأت في تدريب شبكة عصبية تلافيفية مع الرقم
المعلمات أقل بكثير من عدد الصور المحتملة للكلب ، تتدرب
بطريقة بسيطة نسبيًا. تخبرك في المخرج ، هل هو كلب أم لا كلب ، ولكن
تقول لها نعم أو لا. فجأة بعد فترة اتضح أنها تستطيع
تعطي جودة جيدة جدًا على صور الكلاب التي لم ترها.
- هل درجة التعميم عالية بشكل غير متوقع؟- نعم ، هذه درجة غير متوقعة من التعميم. لقد اتفق الجميع على حقيقة أنه يعمل ، الجميع
تطبيقه في كل مكان ، ولكن النتيجة الرياضية مدعومة بصرامة ، والتي من شأنها
شرح لماذا مثل هذه الدرجة من التعميم ممكن ، لا. وهناك العديد من الفرضيات ، واحدة
التي يبدو لي أنها الأكثر إثارة للاهتمام. ليس هذا ما يحدث في الجميع
الخلايا العصبية ، وكيفية ربط هذه الخلايا العصبية. بنية الشبكة ، على ما يبدو ، لك
يتيح لك تحقيق تعميم معين عند مستوى معين. إنه مثير للاهتمام
الفرضية ، لأنه إذا كان صحيحًا ، فهو مرتبط جيدًا بالفيزيولوجيا العصبية ، ثم
يمكنك أخذ وتجربة شيء آخر من الفسيولوجيا العصبية. هناك البعض الآخر
الافتراضات ، ولكن هذا سؤال: يكتب الناس الآن كيلوغراما من المقالات شهريا حول كيفية ذلك
يعمل.
- هناك شعور بأن Python هي لغة AI. هل هذا حادث أم لا؟ لماذا
بايثون ، بعد كل شيء ، هناك الكثير من الأساسيات.- لأن الكثير من عمل عالم البيانات يبلغ الآن
النماذج. إنه ملائم للنموذج الأولي في Python ، تم إنشاؤه كلغة لـ
النماذج ، وليس كلغة للحلول الصناعية. نحن في ABBYY لدينا أشخاص
الذين يقومون بإعداد النموذج الأولي في Python ، وهناك أشخاص يكتبون النماذج النهائية في C ++ ،
التي يتم تنفيذها. يستخدم مجتمع بايثون هذه الموجة بنشاط وهناك ردود فعل إيجابية. هناك طلب ، أي أن علم البيانات يتم تنفيذه بشكل متزايد
Python ، على التوالي ، يبدأ المجتمع في التشبع مع الأشخاص الذين يحاولون
تطوير اللغة نفسها. كل هذا متصل.
- عندما نتحدث عن النماذج ، فإنه ينطوي على تشغيل كبير
عدد الاختبارات والتجارب. هناك مشكلة في الحوسبة
الموارد.- أصبحت موارد الحوسبة نفسها أرخص ، وهناك حلول سحابية صنعت
بأسعار معقولة. بشكل تقريبي ، يمكن للطلاب الذين لديهم إمكانية الوصول إلى الإنترنت لفترة وجيزة
المال للحصول على خادم قوي إلى حد ما ، من أجل دفع شيء عليه وبعض
احصل على النموذج ، وقم بتثبيت الذكاء الاصطناعي ، على سبيل المثال ، في آلة صنع القهوة. هناك العديد من العوامل التي
يقودوا بعضهم البعض. بسبب الإنترنت ، عتبة دخول البرمجة وداخل
التكنولوجيا بشكل عام. ظهر الكثير من الحديد الرخيص نسبيًا
السحابة. يمكنك شراء الوقت وليس الحديد. ظهرت الكثير من البيانات الحية.
على سبيل المثال ، في الثمانينيات ، واجه الأشخاص المشاركون في علوم البيانات مشكلة أساسية: أين
أخذ البيانات؟ والآن بالنسبة لمجموعة من المهام التطبيقية ، من الواضح مكان الحصول عليها.
العناصر الرئيسية لتعلم الآلة: الخوارزمية والبيانات والأجهزة التي يتم ذلك
الخوارزمية تعمل. أصبحت هذه الخيارات الثلاثة أكثر سهولة. في هذه الحالة ، أصبحت الخوارزمية
أكثر بأسعار معقولة ، بمعنى أن هناك حلول محاصر ذات نوعية جيدة. إنهم كذلك
تنفذ بلغة بسيطة وبسيطة وبسيطة
مستوى الدخول ومجموعة من الموارد التعليمية.
- روى شباب مايكروسوفت قصة كيف أخذت مجموعة صغيرة شبكة عصبية
ونموذج الأعمال لشركة صغيرة وبسيطة تقوم بتوصيل الخبز. ومن العصي
الحبال اتضح بناء نموذج عمل على تحسين هذا النشاط التجاري وأعطى + 10٪
إلى الكفاءة. هل مثل هذه الصور على الأرجح استثناء أو قاعدة؟- هذه قاعدة. في رأيي ، Kelly (عالم المستقبل الشهير) لديه محاضرة جيدة حول
الذكاء الاصطناعي المستقبلي ، حيث يقول أنه خلال 20 عامًا سيعاملوننا بنفس الطريقة التي نعامل بها
تعاملنا مع أولئك الذين كانوا رواد الإنترنت. نقول الآن: "كم كان الأمر سهلاً عليك في 90-
سنوات الإلكترونية للقيام بأعمال الإنترنت. " وخلال 20 عامًا سيعاملوننا أيضًا قائلين: "كيف
كان من السهل عليك التعامل مع AI. أخذ أي شيء ، وأضاف منظمة العفو الدولية إليها وأصبح رائدا في ذلك
الفئات ". على الأقل هذا رأي كيلي ، وأنا أشاركه.
- لقد واجهت أنا وأنت قدرًا معينًا مما يحدث في الصناعة ، ورأينا ذلك
كانت الصورة عندما كانت السلعة الآن ذات مرة حالة فنية. بناء على كتابه
الخبرة ، هل يمكننا تقديم المشورة للأشخاص الذين هم الآن جزء من تكنولوجيا الذكاء الاصطناعي
وكيف يجب ان يتحركوا؟- لدي نصيحتين تبدو معقولة بالنسبة لي. أولا ، لا تفعل واحدة في الزاوية.
ابحث عن شخصين متشابهين في التفكير ، واعمل مع بعضهما البعض واظهر
ماذا تفعل داخل المجتمع الأوسع. وثانيًا ، فكر بشكل أقل
نماذج محددة ستستخدمها لأنها ستتغير ،
تتحسن. وإذا لم تكن في المستوى الآن لتحسينها بنفسك ، فأنت
أنت بحاجة إلى معرفة أقل عن كيفية عمل هذا النموذج بالضبط ولماذا هو أفضل. انت تحتاج
فكر أكثر في المشكلة التي تحلها.