كيف يطور مهندس سابق في Google تقنيات بحث جديدة عن المطاعم



في بلوق، تحدثنا حول كيفية أتمتة المطاعم عملهم باستخدام أنظمة الخاصة (على سبيل المثال، Jowi )، ورعاية من الراحة من الزوار مع ضوء الحق والصوت، وكذلك استخدام طرق مختلفة لزيادة متوسط فاتورة و حجم غيض .

بالإضافة إلى ذلك ، اهتمنا بالاتجاهات التكنولوجية لصناعة المطاعم. نشر Wired مؤخرًا قصة مهندس Google السابق Frances Haugen ، الذي يعمل حاليًا على تطوير تقنيات البحث عن المطاعم في خدمة Yelp عبر الإنترنت. نلفت انتباهكم إلى النقاط الرئيسية لهذه المواد.

تنتمي فرانسيس هاوجين إلى الموجة الأولى من مستخدمي Google في عام 1996. قدمت والدتها ، وهي معلمة في جامعة أيوا ، محرك البحث هذا ، الذي كان في ذلك الوقت مشروعًا في جامعة ستانفورد. صدمت Haugen من إنشاء لاري بيدج وسيرجي برين. وتقول: "لقد دهشت بفكرة أنه يمكنك النظر في مثل هذه الكمية الضخمة من البيانات".

منذ ذلك الحين ، أصبحت هوجن مهووسة بدراسة تقنية البحث. بعد الكلية ، حصلت على وظيفة في Google وعملت هناك لعدة سنوات ، أولاً كمهندسة ثم كمديرة منتجات. الآن تعمل في Yelp. قد يبدو لك أن خدمة المراجعة المترامية الأطراف هذه ليست شركة بحث ، ولكن في الواقع هو البحث الذي يقع في صميم عمل Yelp. بعد كل شيء ، لا تحتاج فقط إلى تصنيف أفضل المطاعم القريبة منك - فأنت بحاجة إلى مطعم يقدم Cronats أو مطعمًا يتمتع بإطلالة جيدة. ربما كنت تبحث عن مؤسسة حيث يمكنك أن تأتي مع حيوان أليف ، أو مكان للاحتفال بعيد ميلاد - أو ربما كل هذه الشروط في وقت واحد.

لكن المراجعات والمراجعات التي كتبها المستخدمون حول أي مؤسسة قد لا تحتوي على التفاصيل الضرورية. ربما تكمن معظم المعلومات المفيدة في ملايين الصور التي تم تحميلها. لذا ، على سبيل المثال ، ستتيح لك صورة الكلب التي تتجدد نفسها مع التيجان المزينة بالشموع الاحتفالية على خلفية أفق مانهاتن معرفة أن المطعم يلبي متطلباتك. ومع ذلك ، هناك أمثلة أخرى أقل تافهًا تثبت الحاجة إلى مثل هذه التكنولوجيا.

يقول هاوجين: "تقتصر زوجة جاري على كرسي متحرك". "لذلك ، كان عليه أن ينظر في مئات الصور لمعرفة ما إذا كان المرفق مجهزًا بالبنية التحتية للضيوف ذوي الاحتياجات الخاصة".

إذا تمكنت أجهزة كمبيوتر Yelp من التعرف على الكراسي المتحركة في الصور الفوتوغرافية ، فيمكن للخدمة تقديم اقتراح أكثر استنارة من خلال اختيار الخيارات الأكثر ملاءمة. ومع ذلك ، لا تزال تقنية بحث Yelp بعيدة عن هذا المستوى. أصعب شيء هو تعليم أجهزة الكمبيوتر التعرف على ما هو موضح بالضبط في الصور. لكن Haugen وفريقها بدأوا في وضع أسس نظام التعرف على الصور الذي يمكن أن يغير تكنولوجيا البحث بشكل جذري.

تبحث عن الأفضل


بادئ ذي بدء ، لا يعتمد مشروع التعرف على الصور Yelp الأول على البحث ، ولكن على اختيار أفضل الصور الملتقطة في مؤسسات مختلفة. في كل مرة تذهب فيها إلى Yelp ، تشاهد العديد من الصور في أعلى الصفحة ، وهذه الصور هي التي تشكل انطباعك عن الشركة ككل. تعمل Haugen وفريقها على إنشاء نظام اختيار تلقائي للحصول على أفضل الصور ، بحيث عندما تتصفح الموقع سترى أفضل العروض.

وتقول: "نحاول معرفة كيفية اختيار أفضل الصور التي ستجعل المستخدمين ينتهز الفرصة". "ابحث عن صورة تقنعك بالذهاب إلى مصفف شعر جديد ، واختيار مكان لحفل زفاف أو مطعم حيث يمكنك الاحتفال بعيد ميلاد صديق".

وهذا يعني أن Yelp يجب أن يتعلم التمييز بين صورة شريحة لحم لذيذة وصورة ذاتية غير واضحة. يبدو أن أسهل طريقة هي أخذ التسميات التوضيحية للصور كأساس ، ولكن غالبًا ما يكتب المستخدمون شيئًا مثل "رائع" ، أو حتى لا يوقعون الصور على الإطلاق.

قد يتخذ Yelp مسارًا مختلفًا ويعتمد على تقييمات المستخدمين للصور. ولكن في هذه الحالة ، لن تختلف دائمًا أفضل ثلاث صور في الترتيب في التنوع. عند الانتقال إلى صفحة مطعم Jim Bob ، ربما لن ترغب في مشاهدة ثلاث صور للشريحة ، حتى إذا كانت هذه الصور ذات جودة جيدة جدًا. سوف تكون مهتمًا برؤية الأطباق المميزة غير العادية أو الثور الميكانيكي أمام المدخل. إذا كان Yelp فقط لن يوظف أشخاصًا يشاهدون ويصنفون الصور ، فأنت بحاجة إلى تعليم أجهزة الكمبيوتر للتعرف على ما هو معروض بالضبط في هذه الصور.

تعلم عميق


بالطبع ، لم يواجه Yelp هذه المشكلة فقط. تعمل Google و Facebook - ناهيك عن وكالات إنفاذ القانون والتجسس - على تكنولوجيا التعرف على الوجوه لسنوات عديدة. قامت شركة ناشئة تسمى Orbital Insight بتتبع كمية مخزونات النفط وإزالة الغابات غير القانونية ، وتحليل الصور المأخوذة من الفضاء. استحوذت Google على شركة Jetpac للسفر العام الماضيوهي متخصصة في تطوير الأدلة والخرائط. كان لدى Jetpac ، مثل Yelp ، فكرة تحليل الصور لتحديد الحانات والمطاعم ، على سبيل المثال ، المسموح لها بالدخول مع الكلاب. ترتبط جميع هذه المشاريع تقريبًا بالذكاء الاصطناعي ، أو بالأحرى اتجاهها ، ما يسمى " التعلم العميق ". التعلم العميق هو نوع من التعلم الآلي يعتمد على محاكاة الدماغ البشري.

في السنوات الأخيرة ، ازداد اهتمام شركات التكنولوجيا الكبيرة بالتعلم العميق بشكل ملحوظ. استعانت Google و Facebook بخبراء رائدين في هذا المجال ، كما استحوذت على العديد من الشركات الناشئة لمواصلة أبحاثهم الداخلية. في غضون ذلك ، تحولت Microsoft إلى التعلم الآلي لإنشاء خدمة ترجمة فورية.سكايب ترجمة . ولكن نظرًا لأن عمالقة التكنولوجيا لا يحتكرون الذكاء الاصطناعي ، يمكن لشركات مثل Yelp أيضًا استخدام نتائج البحث لصالحها.

لإطلاق هذا النظام ، استخدم فريق تطوير Yelp مكتبة Caffe مفتوحة المصدر لإنشاء شبكة عصبية - برمجيات تناظرية للروابط بين الخلايا العصبية في الدماغ البشري - بناءً على العملكبار الخبراء في مجال التعلم العميق. لكن البرنامج نفسه لا يستطيع القيام بهذا القدر من العمل. من أجل التعرف على شيء ما - سواء كان قطة أو كب كيك أو سيارة - هناك حاجة إلى خوارزمية يتم تجميعها من قبل شخص. تحقيقا لهذه الغاية ، استأجرت Yelp أشخاصًا لتصفح موقع Crowdflower والمساعدة في تصنيف عدد كبير من الصور.

في البداية ، ركزت جهود التعلم الآلي على تصنيف الصور من المطاعم إلى أربع فئات: الطعام ، والقائمة ، وشكل المطعم ، والداخلية. لكن Haugen يأمل أن تكون جميع البيانات التي تم الحصول عليها خلال هذه العملية مفيدة في تطوير وظائف Yelp. وفي الوقت نفسه ، تحاول معرفة الصور التي تحصل على أكبر عدد من المشاهدات. الناس يحبون الخطية ، على سبيل المثال ، عندما تظهر الصورة ثلاثة فناجين من القهوة على التوالي. الابتسامات تجذب الانتباه دائمًا ، مثل الأزرق. ولكن في كثير من الأحيان ، يشاهد الأشخاص الصور التي تم التقاطها بزاوية منخفضة. يشرح Haugen: "إذا كنت تريد التقاط صورة لعشاءك ، فيجب عليك تخفيض الكاميرا إلى مستوى الطاولة".

Source: https://habr.com/ru/post/ar387207/


All Articles