
بالتأكيد ، يتذكر الكثير الحلقة الرابعة من الموسم الرابع من وادي السيليكون ، التي تم إصدارها العام الماضي ، حيث قام Dzang Young بإلغاء تطبيق Not HotDog.
كما اتضح في الواقع ، كان تطبيقًا حقيقيًا جعل HBO خصيصًا لهذه السلسلة ،
وقد كتب هابر بالفعل عن ذلك.
حسنًا ، سنخبرك كيف صنعنا روبوتًا ليس فقط لتحديد الكلاب الساخنة ، ولكن أيضًا العديد من العناصر الأخرى ، وكذلك لتحديد جنس وعمر الأشخاص من الصور الفوتوغرافية.
الخلفيةلن نتعامل مع الشبكات العصبية. لقد أردنا فقط إنشاء مشروع لزيادة إنتاجية التجار في شبكات البيع بالتجزئة.

تشمل واجبات التجار ، على وجه الخصوص ، التحقق من توافر السلع على الرف ، لذلك يجب عليهم زيارة منافذ البيع بالتجزئة كل يوم تقريبًا والإبلاغ عن وجود / عدم وجود السلع إلى المشرف.
كقاعدة ، يتم تخصيص العديد من المتاجر للتاجر وكل يوم يذهبون إلى الحقول - إلى المنافذ المخصصة لهم.
عادة ما يكون التجار ملزمين بتصوير رفهم وإرسال هذه الصور إلى المشرف - كما لو كان دليلاً على أن التاجر كان بالفعل في المتجر.
من الناحية العملية ، لا يعمل التجار ، الذين هم أدنى مستوى في التسلسل الهرمي لمندوبي المبيعات والذين يحصلون على القليل من المال مقابل عملهم ، بحسن نية ، وأحيانًا لا يذهبون إلى الحقول ، ولكن يرسلون صورًا قديمة إلى مشرفيهم. يتم طردهم ، يذهبون إلى شبكات أخرى ، وتكرر العملية مرة أخرى - في هذا الموقف هناك دائمًا دوران كبير للموظفين وهناك مجموعة ثابتة من التجار.
يقوم المدراء بجميع أنواع المحاولات لتحسين التحكم في التجار - فهم يقدمون تطبيقات صعبة ذات إحداثيات جغرافية ، مع عدم القدرة على إرسال الصور القديمة ، إلخ.
يتم أيضًا تعيين المتسوقين السريين للتحكم في التجار - يجب عليهم التقاط صور الرف في المتجر ، ووضع المواد ، وما إلى ذلك. حتى أن هناك شركات تبحث عن هؤلاء المتسوقين السريين بين الطلاب وأطفال المدارس ، وما إلى ذلك ، وتبيع هذه الخدمات للبيع بالتجزئة. ولكن هنا يبرز السؤال - من سيسيطر على المتسوقين السريين ، أي أن كل شيء يعتمد على وعي الشخص يحتاج إلى مراقبة مستمرة. ولا يزال التجار يجدون طرقًا للتغلب على السيطرة ، بشكل عام ، مشكلة الدرع والسيف.
وظهرت الفكرة بشكل عام للتخلي عن العامل البشري. الحل الذي نقدمه هو أننا نوفر تحكمًا مرئيًا في عرض السلع والتحكم في توفر السلع على الرف دون مشاركة التجار على الإطلاق ، ونقوم بذلك على مدار الساعة طوال أيام الأسبوع.
والحقيقة هي أن رسولنا لديه وظيفة المراقبة بالفيديو ، أي أنه يمكنك وضع هاتف ذكي غير مكلف على النقطة وإتاحة الوصول للعرض لجميع الأطراف المهتمة - التاجر ، المشرف ، القائد ، إلخ. وهكذا ، يمكنك أن ترى في الوقت الحقيقي في أي وقت ما يحدث على الرف ، على التوالي ، التاجر لديه دائما المعلومات ذات الصلة - سواء كان بحاجة للذهاب إلى الكائن أم لا.
يمكن للمشرف أيضًا مراقبة عمل التاجر في أي وقت ، والرئيس ، على سبيل المثال ، إذا كانت شبكة اتحادية بها عدد كبير من الممثلين في المناطق ، يمكن أن يرى ما يحدث ببضائعه في أي مدينة وفي أي وقت.
ينشأ سؤال معقول - لماذا لا تستخدم كاميرات فيديو غير مكلفة لمثل هذه المهمة؟
الجواب هو سهولة تثبيت المراقبة بالفيديو باستخدام الهاتف الذكي وسهولة الاستخدام في برنامج المراسلة.
في معظم الحالات ، بالنسبة لكاميرا الفيديو غير المكلفة التي تحتوي على اتصال Wi-Fi فقط ، فأنت بحاجة إلى استخدام شبكة Wi-Fi هذه في مكان ما وعلى الأرجح ستحتاج إلى جهاز توجيه مزود بمودم 3-4G ، أي أنك تحتاج إلى جهازين بالفعل. بالإضافة إلى ذلك ، يحتوي الهاتف الذكي بالفعل على بطارية ، أي لا توجد مشكلة أثناء انقطاع التيار الكهربائي.
لكي يعمل جهاز التوجيه بشكل صحيح ، يجب أن يتم ضبط إعدادات معينة من قبل موظفين مؤهلين أكثر أو أقل ، وفي حالة الهاتف ، يتم تشغيل وضع مراقبة الفيديو ببساطة شديدة ويمكن لأي مستخدم تقريبًا إجراؤه.
أيضًا ، لعرض عدد كبير من الكاميرات ، تحتاج إلى برنامج خاص ، تحتاج إلى التفكير في الوصول ، وإعطاء أسماء المستخدمين وكلمات المرور ، وفي حالة المراسلة ، يتم تنظيم الوصول إلى العرض ببساطة شديدة - لدى المستخدم المناسب قائمة بالكاميرات المسموح له به وهذا كل شيء.
تكلفة الهاتف الذكي منخفضة أيضًا - من 25-30 دولارًا في متاجر التجزئة. بالنسبة للهواتف الذكية ، هناك العديد من أنواع الحوامل ، فهناك هواتف ذكية صغيرة يمكن وضعها ، على سبيل المثال ، أضواء داخلية للأرفف ، إلخ.
مشكلة 8 مليارات دولار
في عملية الغوص في الموضوع ، اتضح أنه ، على سبيل المثال ، مشكلة توافر السلع على الرفوف في المتاجر (OSA - On Shelf Availability) عالمية ونتيجة لنقص المنتجات الضرورية على الرفوف ، تخسر الصناعة العالمية ما يصل إلى 8 مليارات دولار سنويًا.
هناك العديد من الشركات الناشئة التي تحل هذه المشكلة بمساعدة الشبكات العصبية - التاجر ، أثناء ظهوره في المتجر ، يلتقط صورة من الرف ، ويرسلها إلى السحابة ، وتتحقق الشبكة العصبية من الصورة مع مخطط البيانات وترسل النتيجة على شكل تلميحات - المواقف التي تقف بشكل صحيح ، أي المنتجات ليست على الرف الخ.
ولكن هناك أيضًا عامل بشري - جاء موظف في الصباح ، والتقط صورة ، ونشر البضائع وفقًا للقواعد وغادر. وبعد ذلك ، حرفيا بعد 5 دقائق ، يمكن أن تأتي الحافلة مع العملاء الذين سيغيرون كل ما فعله ، وسيعتقد المشرف أن كل شيء على ما يرام.
لذلك ، في رأينا ، من الأفضل إجراء التحليل عدة مرات خلال اليوم ، علاوة على ذلك ، يمكن أن تساعد هذه التحليلات في تحديد الأنماط في مبيعات سلع معينة.
لتنفيذ هذه الفكرة ، قررنا أنه من الأفضل التقاط العديد من الصور خلال اليوم وإرسالها بشكل دوري للتعرف عليها على السحابة.
ولكن لم تكن لدينا أي خبرة في العمل مع الشبكات العصبية ، وبدا من الصعب إلى حد ما أن نصنع محركنا الخاص بنا ثم ندربه.
لذلك ، قررنا اتخاذ بعض الحلول الجاهزة. قد يعتقد شخص ما أن هذا النهج خاطئ - عليك أن تدفع مقابل معالجة الصور في السحابة.
ولكن هناك حجج مضادة - جعل المحرك الخاص بك مكلفًا وطويل الأمد ، وتحتاج إلى تدريب الشبكة العصبية ، وهذه أيضًا عملية شاقة.
بالإضافة إلى ذلك ، باستخدام الحل الجاهز ، يمكنك طرح المنتج النهائي بسرعة ، وعدم الانخراط في إنشائه ، والخطو على جميع أنواع المكابس والتعلم من أخطائك. ولم نرد أن نصبح متخصصين في الشبكات العصبية - بالنسبة لنا هم مجرد أداة لحل مشاكل معينة.
بالإضافة إلى ذلك ، يحتوي السوق بالفعل على العديد من المنصات التي يمكن استخدامها - Amazon Rekognition و Google API وما إلى ذلك. مع تطور هذه المنصات والتنافس بينها ، فإن السعر سينخفض فقط.
لذلك ، قررنا استخدام IBM Watson مع محرك التعرف البصري الخاص به.
بوت التعرف البصريكان أحد المنتجات الثانوية للمشروع للتحكم في عرض البضائع على الرفوف بوتًا ، والذي أطلقنا عليه اسم التعرف المرئي.
البوت قادر على تحديد جميع أنواع الأشياء من الصورة التي تم تنزيلها أو التقاطها ، ويعرف أيضًا كيفية تحديد جنس وعمر الأشخاص من الصورة.
البوت نفسه ، خوارزميته ، نشرنا أيضًا على IBM Watson ، وبالتالي يستخدم محرك التعرف البصري مع شبكة عصبية مدربة أكثر أو أقل في نفس المكان.
على منصة Bluemix ، يبدو البوت كما يلي:
كيفية استخدام البوتقم بتنزيل M1 Messenger
لنظام Android أو
iOS .
بعد التسجيل في البحث ، نجد برنامج التعرف المرئي:

أضف إلى البوت:

سيقوم البوت بإنشاء محادثة في علامة التبويب Business:

الآن يمكنك تحميل الصور إليه:

انقر فوق معالجة والحصول على النتيجة:

لذلك ، يحدد النقانق ، جرب الهامبرغر:

هناك تطبيق شائع إلى حد ما
Vivino ، حيث يمكن للمستخدم التقاط صورة للملصق من زجاجة من أي نبيذ والحصول على جميع الخصائص والتصنيفات والأسعار وما إلى ذلك:

بمساعدة روبوت التعرف المرئي ، يمكنك ببساطة القيام بنفس الشيء تقريبًا بالنسبة للبيرة والفودكا وما إلى ذلك. - لدى IBM Watson وحدة تعليمية.
حسنًا ، التعرف على العمر بالصور:

بالإضافة إلى الجنس والعمر ، لا تزال الشبكة العصبية تحاول تحديد مهنة الملابس:

تحديد العمر والجنس والإحداثيات في الصورة:


