تبدأ RUVDS مع Habr مشروعًا يتكون من سلسلة من المقابلات مع ، في رأينا ، أشخاص في بيئة تكنولوجيا المعلومات. نقدم اليوم مقابلة مع رئيس تطوير الأنظمة التفاعلية في Yandex ، بوريس يانجيل.
لماذا أليس ، وليس ماكس ، ما كان وزير الاتصالات السابق نيكيفيروف على خطأ بشأنه ، لماذا أطلقت تسلا إلى الفضاء. إجابات في الفيديو والنص تحت القطع.
أجرى المقابلات كل من ليرا نيجرا ومحرر هبر نيكولاي زيمليانسكي.
مرحبًا أنا ليرا نيجرا ، واليوم ضيفنا هو بوريس يانجيل ، رئيس مجموعة تطوير أنظمة الحوار في Yandex. بالطبع ، سنبدأ بعملك ، ماذا تفعل الآن في Yandex؟- الآن في Yandex ، مشروعي الرئيسي هو Alice ، المساعد الصوتي الذي أطلقته Yandex في أكتوبر الماضي ، ومجموعتي مسؤولة عن ما يمكن تسميته بشكل عشوائي أدمغة Alice. نحن نفسر ما قاله المستخدم بلغة طبيعية ونحوله إلى بعض التمثيل المنظم. هذه هي مهمتنا الأولى ، والثانية عندما نعرف بالفعل ما يحتاج المستخدم للإجابة عليه ، قم بتحويله إلى إجابة بلغة طبيعية أيضًا.
"
لقد كنت في هذا المنصب لمدة عامين حتى الآن." كل هذا الوقت كنت تشارك في التنمية. هل كان الإفراج عن مساعد صوتي متأخراً حيث أطلقه المنافسون في وقت سابق؟"لا ، بالطبع ، لم يفت الأوان بعد." إذا نظرنا إلى المنافسين ، من هو المنافس الحقيقي؟ هناك Siri ، المساعد الصوتي الوحيد الذي يفهم اللغة الروسية أيضًا ، ولكنه يعمل فقط على iOS و MacOS ، وهو ليس النظام الأساسي الأكثر شعبية في روسيا ، وهناك أسئلة معينة حول Siri كمنتج. علاوة على ذلك ، لنفترض أن Google ستطلق مساعد Google بالفعل باللغة الروسية ، فهل يستحق الأمر المشاركة؟ حسنًا ، ربما كان الأمر يستحق ذلك على أي حال ، لأنه يمكنك محاولة التنافس مع Google على منطقتك للحصول على جمهور ، خاصة وأننا نجحنا في البحث أكثر أو أقل. حسنًا ، وربما ، النقطة الأخيرة هنا مهمة: ما نراه الآن هو فجر عصر أنظمة الحوار ، وفي الواقع ، لا Google ، ولا Apple ، ولا ، على الأرجح ، ما زلنا نعرف كيف نجعلها طبيعية. عند مقارنته بمحركات البحث ، مع ما حدث في أوائل العقد الأول من القرن الحادي والعشرين ، فإن هذا هو عصر Altavists بشكل مشروط ، عندما تكون هناك بعض المنتجات ، لكنهم لا يزالون يعملون على بعض المبادئ الغريبة ويعملون كذلك ، وفي أي وقت تأتي جوجل مشروطة وتغيير الصناعة تماما. لذلك ، بالطبع ، لا يزال الأمر يستحق الدخول فيه الآن. الكثير من التحديات والمشاكل التكنولوجية التي لم يتم حلها بعد. قد يأتي لاعب جديد ويدير كل شيء ، ونحن في الواقع في وضع أكثر فائدة قليلاً ، لأننا بدأنا في وقت لاحق ، مما يعني أن لدينا تراكم أقل ، أي أنه يمكننا العمل على الفور مع التقنيات الجديدة. وسيري ، على سبيل المثال ، الذي يعرفه الله متى فعل ذلك ، لديه الكثير من الرموز القديمة التي يصعب تعديلها بالفعل ، ولهذا السبب يواجهون الكثير من المشاكل.
-
في خطابك في أكاديمية Yandex ، قلت أنك استقلت قطارًا معينًا. كيف نجح وترك هذا القطار الآن؟- ربما كان ذلك ممكنًا في المقام الأول بفضل قرار جريء للغاية تم اتخاذه في منتجنا. لدى جميع المنافسين عدد معين من السيناريوهات التي يتم توضيحها بشكل صارم في هذه المنتجات: "يمكننا الإجابة على مثل هذا السؤال ومثله ، والتحدث عن الطقس أو أي شيء آخر ، وإذا كان ما يقوله المستخدم لا يندرج تحت أي من هذه السيناريوهات ، ثم نرد بنوع من الروتين مثل "آسف ، لم أفهمك". قررنا أن نتصرف بشكل مختلف وأنشأنا وحدة شبكة عصبية يمكنها في مثل هذه الحالات الاستجابة بشيء قد يكون مناسبًا في سياق الحوار السابق ، وفي الواقع يمكنها التواصل مع المستخدم في أي موضوع. قد لا يكون مناسبًا دائمًا بنسبة 100 ٪ ، ولكن في أكثر من نصف الحالات يمكنه بالتأكيد أن يقول بعض الأشياء التي يجب أن يقال في تلك اللحظة. وقالت وحدتنا الكثير من الأشياء التي يحبها المستخدمون. إجابات أليس السخيفة ، التي لم نضعها هناك ، لكنها ولدت نفسها ، انتشرت على الفور عبر الشبكات الاجتماعية ، وهذا خلق قطار الضجيج. بالطبع ، يترك قليلاً ، هذا أمر لا مفر منه ، كل هذه النكات مملة ، لكننا نحاول تطوير المنتج بشكل أكبر والتقاط الضجيج شيئًا فشيئًا حيث نستطيع.
-
لقد حاولت أن تجعل أليس مثيرة للاهتمام قدر الإمكان لمستخدم روسي. كيف تم اختيار الصوت ، ولماذا كانت أليس؟- بصراحة ، لم أشارك في عملية اختيار الصوت ولا أعرف ما هي المبادئ التي تم تنفيذها ، باستثناء أنه صوت رائع للممثلة الروسية تاتيانا شيتوفا ، التي يحبها الجميع ، يمكن التعرف عليها تمامًا.
يمكنني التحدث عن اسم أليس وعن الخصائص. فكرنا وكتبنا عددًا من العقارات التي نرغب في الحصول على مساعد لها. على سبيل المثال ، لا يجب أن يكون متعجرفًا ، أو يساعد شخصًا ، أو يكون ودودًا ، أو ذكيًا ، أي مجموعة من الخصائص الإيجابية والسلبية. ثم سألنا الناس على منصة التعهيد الجماعي لدينا ، على سبيل المثال ، هل هذا الاسم مرتبط بهذا العقار أم لا؟ لقد نظرنا إلى الأسماء التي اخترناها سابقًا من بعض المبادئ التي ترتبط أكثر بالخصائص الإيجابية أكثر من الخصائص السلبية ، وبهذا المعيار ، دمر اسم أليس ببساطة جميع المنافسين الآخرين من القائمة القصيرة. ربما يرجع ذلك إلى حقيقة أن هذا الاسم في الثقافة الروسية يحتوي على بعض التعليقات التوضيحية الإيجابية ، على سبيل المثال ، Alice in Wonderland ، Alice Selezneva ، أمثلة كلاسيكية. وهذا ينطبق أيضًا على الخصائص الصوتية للاسم. نظرًا لأن هذا هو الاسم الذي سيتم توجيهه إلى Alice ، فمن الضروري عدم وجود أصوات يجد بعض الأشخاص صعوبة في نطقها. على سبيل المثال ، يجب ألا يكون الحرف "P" موجودًا بالتأكيد ، ولا يجب أن يكون الهسهسة كذلك. اسم أليس يلبي هذه الخصائص.
-
لماذا أليس ، وليس ماكس ، لماذا هي ليست رجلاً؟- في الواقع ، تم إجراء الكثير من الأبحاث ، والمرأة هي الخيار الأكثر أمانًا. لقد جعلنا التطور سعداء للغاية لأن المرأة هي أم ، شيء آمن ، عزيز ، والرجل محارب سيأتي مع الرمح ويقتلك. لذلك ، فإن المساعد الإناث طبيعي لكل من النساء والرجال ، ولكن إذا كان المساعد رجلاً ، فسيتم استخدام مثل هذا المنتج بشكل أقل.
-
قبل بضع سنوات ، لم تكن هناك قصة ممتعة للغاية عندما تصرف روبوت دردشة Microsoft بشكل غير صحيح تمامًا. هل كان هناك خطر مماثل مع أليس ، أو ربما حدثت مواقف مماثلة؟- بالطبع كانت كذلك ، وفكرنا كثيرًا في هذه القصة عندما تم إطلاق أليس. كما قلت سابقًا ، لدينا وحدة شبكة عصبية تستجيب في أي موقف ، وليس فقط في إطار السيناريو. ولديه الحرية المطلقة ، في الواقع. في حدود بعض القيود التي وضعناها ، لديه حرية الكلام ، وفي بعض الحالات يمكنه أن يقول أشياء لا نريده أن يقولها. لغتنا قوية وغنية للغاية ، وهناك مليار طريقة للاتفاق أو عدم الموافقة ، ولن نحسبها جميعًا أبدًا. كيفية منعها من الاتفاق عندما تُسأل عن شيء خطير بالفعل مهمة بحث صعبة للغاية.
-
هل هو مرتبط بطريقة أو بأخرى بحقيقة أنها غالبًا ما تقول: "لا أريد التحدث عن ذلك"؟- تقول "لا أريد التحدث عن هذا" عندما نفهم أن الوضع خطير للغاية بالنسبة لوحدة الشبكة العصبية لإعطاء إجابة. في الواقع ، إذا سمحت لأليس بأن تقول نعم أو لا ، فهذا يكفي للإساءة إلى أي شخص. يكفي أن تسألها: "هل تؤيد X" حيث X هي الفاشية والإبادة الجماعية ، أيا كان. إذا قالت نعم ، كل شيء ، ذهب الكتابة.
-
بعد التخرج ، بدأت العمل على الفور في Yandex ، وكان قسمًا يشارك في البحث عن الصور عن طريق طلب النص. بعد ذلك ، هل تقرر فجأة العمل في Microsoft Research في كامبريدج؟
- حسنًا ، ليس فجأة ، كان الأمر طبيعيًا. لقد عملت في Yandex ، وأردت تطوير المزيد ، للقيام ببعض الأشياء الأكثر تعقيدًا.
-
ألم يعمل في ياندكس؟- في ياندكس ، اتضح من ناحية ، من ناحية أخرى ، بدأت بالفعل في قيادة مجموعة في ياندكس كانت مسؤولة عن جودة البحث في الصور. ربما لم أكن على استعداد جيد لعمل القائد ، ولم يعجبني حقًا ، لقد أحببته ، والآن أحب البرمجة ، وترك العمل فرصًا قليلة جدًا لذلك ، ما لم ترغب في العمل 16 ساعة في اليوم. لم يعجبني ذلك كثيرًا ، كنت أرغب في التطوير كمبرمج ، متخصص في تحليل البيانات ، وهنا أتيحت لي خيارًا رائعًا ، شاغرًا في Microsoft ، لأنه كان وثيق الصلة بخلفيتي.
-
ماذا فعلت هناك؟- هناك مثل هذا المجال في التعلم الآلي ، ويسمى الاستنتاج بايزي. يتعلق الأمر بكيفية اتخاذ قرارات عقلانية تمامًا في ظروف المعلومات غير الكاملة ، بحيث يمكن للمرء أن يثبت أنه لا يمكن اتخاذ قرار أكثر عقلانية في هذه الحالة. لقد عملت في فريق أنشأ مكتبة برمجيات ، يمكن من خلالها استخدام القوة الكاملة لهذا الجهاز الرياضي لاتخاذ قرارات في بعض المواقف. في الواقع ، هذه مكتبة للتعلم الآلي ، تستند ببساطة إلى بعض المبادئ المحددة ، غير التقليدية.
-
والعمل هناك مهيأ لمنصب قيادي؟- لا ، عندما عدت من كامبريدج إلى ياندكس ، طلبت مني بصدق ألا أقود أي شخص ، إذا كان ذلك ممكنًا سأكتب الرمز ، فأنا أحب حقًا كتابة الرمز. في الوقت نفسه ، لم أشارك في أهم المشاريع للشركة ولم أفصح عن وظيفتي بالكامل. في البداية كنت أقوم بتطوير خلفية لبعض التطبيقات التجريبية للهواتف المحمولة ، ثم في مجموعة من الشبكات العصبية قمت بتطوير طرق تصنيف النص ، وفي مرحلة ما قررت الإدارة: لماذا لا تفعل شيئًا مفيدًا ، اذهب تفعل أليس.
-
قبل عامين ، ناقشت الصحافة بنشاط حقيقة أن التعليم الأساسي لتكنولوجيا المعلومات ، على الأقل في بلادنا ، لم يتم تطويره بشكل كاف. ما مدى استعدادك؟ ما الذي ساعدك؟ هل هذه مدرسة ياندكس ، أو هل شعرت بالثقة الكافية بعد الجامعة؟- يمكنني البرمجة لأنني قمت بالبرمجة كثيرًا. عندما كنت طفلاً ، جلست على الكمبيوتر وبرمجت في الجامعة أيضًا. ذهب الجميع إلى مكان ما لتناول مشروب ، وقد ذهبت إما لتناول مشروب أو جلست البرمجة ، ومنذ العام الأول عملت في شركات حقيقية ، اكتسبت خبرة في الصناعة تقريبًا. كانت هذه المعرفة الأساسية كافية لفهم الأشياء الأخرى اللازمة مباشرة للعمل بنفسك. بالطبع ، ساعدت
مدرسة تحليل البيانات ، هذه مبادرة رائعة تعطي المعرفة التي تفتقر إليها حاليًا عند الخروج من الجامعة. صحيح ، لقد درست هناك لمدة عام واحد فقط ، لأنه استغرق الكثير من الوقت ، كان هناك الكثير من المهام ، مثل تلك المهام الصعبة. لقد عملت بالفعل في Yandex ، لم يكن لدي وقت. ولكن بشكل عام ، أود أن أوصي الجميع بالذهاب إلى هناك.
-
وفقًا لوزير الاتصالات السابق نيكيفوروف ، يوجد في بلدنا بالفعل عدد كبير جدًا من المبرمجين والعديد من المتخصصين في مجال تكنولوجيا المعلومات. هل هذا صحيح؟ هل يوجد بالفعل العديد من المتخصصين الجيدين؟- لا أعرف كيف يفكر السيد نيكيفوروف ، ولكن بصفتي شخصًا بحاجة إلى توظيف متخصصين مباشرةً في فريقه ، فإنني أعاني من مشاكل كبيرة في التوظيف. لدينا مهمة صعبة نوعًا ما ، وهناك حاجة إلى متخصصين بمستوى أعلى من المتوسط. لا يوجد عمليًا مثل هؤلاء المتخصصين الذين أحتاجهم في السوق ، جميع أولئك الذين من المرجح أن يعملوا بالفعل في Yandex ، حسنًا ، في عدد قليل من الأماكن الأخرى. لا أعرف من يعتبره مبرمجًا ، ولكن هناك عدد قليل جدًا من المتخصصين المؤهلين تأهيلًا عاليًا ، خاصة في مجال الشبكات العصبية ، والتدريب المتعمق.
-
ماذا ترى وجهة عملك ، سواء في شركة منفصلة أو بشكل عام في الصناعة؟- على الأرجح ، إذا نظرت إلى الأشياء على مستوى العالم ، فسيكون من الرائع أن نتوصل إلى شيء رائع ، أو تقنية أو فكرة تجعل الناس الذين يأتون إلى الصناعة بعدني يبنون تطوراتهم الخاصة على هذه التكنولوجيا. أي أنها ستدخل المؤسسة ، كما كانت ، والتي يبنى عليها كل شيء تدريجيًا. لا أعرف ماذا سيكون ، ولكن أود أن أترك بعض أثره على الأقل ، ومن الأسهل القيام بذلك ، ربما إذا تطورت كقائد ، لأنه بعد ذلك هناك المزيد من الموارد ، يمكنك تجربة بعض الأفكار العالمية والطموحة . لكن إذا وضعت يدي في قلبي بشكل مستقيم ، لا أستطيع أن أقول أنني أحب قيادة الناس حقًا ، إنه عمل شاق حقًا ، يستغرق الأمر الكثير من الوقت والقوة الأخلاقية ولا يسمح لي بعمل ما أحب القيام به - البرمجة. لذلك ، أود أن أتطور في اتجاه يسمح لي بالعثور على التوازن الأمثل بين حجم الأشياء التي يمكنني القيام بها والتي يمكنني التأثير عليها ، والقدرة على القيام بهذه الأشياء مباشرة بيدي. بالنسبة للصناعة ككل ، هذا سؤال أكثر إثارة للاهتمام. يبدو لي أن الشيء نفسه يحدث مع الواجهات الصوتية التي حدثت مع الواجهات الرسومية ، عندما بدأت للتو في الظهور ، عندما ظهرت شاشات الألوان الأولى ، وقمنا بالتبديل من وحدات التحكم حيث كان من الضروري إدخال الأوامر ، إلى بعض الأزرار التي كان من الممكن للضغط. وعندما ظهرت لأول مرة ، لم يكن أحد يعرف كيف يصنعها بشكل طبيعي ، ولم تكن هناك نماذج ، وأنماط معمارية ، وأطر ، وكان الجميع يفعلون كل شيء ، وكانت الواجهات ملتوية ، وبائسة ، وكان من الصعب جدًا صنعها ، وكان من المستحيل قراءة الرمز ، ولكن الناس فكرنا في ذلك ، وظهرت بعض المفاهيم الجميلة تدريجيًا حول كيفية جعل هذه الواجهات ، ظهرت أدوات مناسبة ، والآن يمكن للمحترف في هذا المجال إنشاء موقع ويب مع بعض الواجهات المعقدة إلى حد ما بسرعة كبيرة. نحن نفكر في كيفية القيام بنفس الشيء مع واجهات الصوت. ما هي الأدوات التي يجب أن تكون ، بحيث يمكن القيام بها بشكل ملائم بحيث تصبح جيدة. حتى إذا لم نحصل فجأة على منتج جيد ، ربما سنستفيد من الصناعة بأكملها ككل من خلال اختراع شيء ما في هذا الاتجاه.
-
ما الذي يمكن أن يحل محل أليس؟- أنا لا أعرف ماذا سيكون. أي واجهة يمكن أن تكون أكثر ملاءمة من الصوت ... ربما السيطرة على قوة الفكر ، شيء من هذا القبيل.
"
إذا ماتت أليس ، هل ستحزن؟"- سأترك بلا عمل ، نعم ، سأكون حزيناً.
-
الشركات الكبرى والمشاريع الكبيرة ، ما أول المرشحين للرحيل برأيك؟"حسنًا ، ربما لن أعطي أي أسماء ، فهذا سيكون خطأ". لا أستطيع أن أقول أن شخصًا ما هو مرشح للرحلة ، لأنه يصنع منتجًا سيئًا. حيث توقعت الإخفاقات ، هذا هو المكان الذي تحتاج فيه إلى أي دعم لتطوير الأعمال. على سبيل المثال ، سوق سيارات الأجرة ، أو نوع ما من توصيل الطعام المشروط - Food Fox ، Deliveru Club. من ناحية ، هذه مشاريع تكنولوجيا المعلومات ، من ناحية أخرى ، تتفاعل مع العالم الحقيقي. للذهاب إلى هناك ، تحتاج الآن إلى دعم الكثير ، وإغراق المنافسين لتقديم أسعار تنافسية للغاية ، وإخراج الجميع من السوق ثم رفع الأسعار. هذا يؤدي إلى حقيقة أن العديد من الناس يأتون ويحترقون هناك لمجرد أنهم ينفدون من المال. ليس لديهم الوقت للضغط على أي شخص ، ويسحق رواد صناعة سيارات الأجرة مثل Yandex في بعض أسواق Uber الجميع.
-
العملات المشفرة. تستثمر ، لا ، تستثمر ، ماذا ، لماذا.- أنا لست أنجح مستثمر في التشفير ، أنا واحد من هؤلاء الأشخاص الذين قرروا الاستثمار قليلاً في أكثر اللحظات غير المناسبة ، بالطبع ، والآن يجلسون ويأملون في أن ينمو Bitcoin مرة أخرى. لا تفعل مثلي.
-
هل حاول المنافسون جذبك؟- نعم ، أجيب عادةً أنني لا أبحث عن وظيفة أخرى.
-
إذا لم تكن لتكنولوجيا المعلومات ، فماذا بعد ذلك؟- لا أعرف ، أنا مغرم بالمظلات ، ربما بعد ذلك سأصبح مدربًا في القفز بالمظلات.
-
لماذا تطلق تسلا في الفضاء؟- لأنه رائع.
-
شكرا جزيلا ، بوريس. سوف يسألك ضيفنا اليوم نيكولاي زيمليانسكي ، محرر هابر ، بعض الأسئلة الإضافية.-
مرحبًا بوريس. أريد أن أتذكر الفيلم الذي تم إصداره مؤخرًا ، Blade Runner 2049 ، حيث كان للعامل K مساعد Android. لا أتذكر اسمها ، دع ماشا تكون. عندما تحدثوا ولم يعجبه شيء ، كان بإمكانه أن يقول: "Masha، bitchiness minus three" أو "Masha sexity plus خمسة". بناءً على ذلك ، تم تعديل الاتصال مع المساعد. ما الذي تعتقد أنه حقيقي في المستقبل المنظور ، وهل هناك أي معنى على الإطلاق؟- لقد تحدثت بالفعل قليلاً عن كيفية تعاملنا مع الإجابات المهينة لأليس. هذه كلها قصة كبيرة حقا ولهذا السبب. حتى لا تسيء Alice إلى المحاور ، فنحن في الواقع نعلم بعض النماذج للتنبؤ بما إذا كانت هذه الإجابة أو تلك مسيئة ، وإذا كان الأمر كذلك ، إلى أي مدى. الآن نستخدم هذه النماذج وفقًا لمبدأ بسيط للغاية: إذا قال النموذج أن الجواب مسيء ، فإننا لا نعطيها إجابة. بالمصطلحات التي تقولينها ، نقوم بتحريف الإهانة إلى الصفر. في الواقع ، لدينا بالفعل نموذج لتقييم تدرج هذه الإهانة ، وإذا نشأت حاجة للمنتج ، فيمكننا بالفعل عمل شريط تمرير يجعل الإجابات أكثر أو أقل جرأة. يمكن تطبيق النهج الذي نستخدمه لهذا على الخصائص الأخرى لسلوك النظام. سيتطلب هذا ، بالطبع ، بعض العمل الخاص بكل خاصية محددة ، ولكن لجعل مثل هذا المساعد ، الذي يمكن تعديل خصائصه باستخدام أشرطة التمرير ، لن يكون ممكنًا خلال 20 عامًا ، ولكن قريبًا ، كما يبدو لي.
—
, , , , , «». , . . , , ?— , , , . . . , , . , . - , , . , , , . , , , . , : , - , , . , - , .
, « » -, , , , - — - , — , . « », . .
—
, . , , , - ?— , , , , , - , - , — , , . , , . , , , , . , , - , - . — , , , .
—
, .— , , , , .
—
, , , , .— , -.
—
. ? , , , . , ?— . Google, , Google- , . , , , . , , .
—
, , ?— . . , , , . Google, , . , .
—
, Siri. ?— , -, , . , , , , , , . . , , - , . , , , . . , , , . , - . , — , -, . , , .
—
, , , , ?— , , . , , . , - — , . - , . — , , , . , Google .
- شكرا لك بوريس ، كان من الجيد التحدث معك.
- اهلا وسهلا.