كان لدينا يومين بين المشاريع الكبيرة ، وقررنا أن نسخر من باب رأس الوحدة. للمرح فقط. لأن الطائرات بدون طيار تتعرف علينا بالفعل في وجوهنا - ما الذي يجعل الباب أسوأ؟
في وقت بدء مشروع تكنولوجيا المعلومات ، كان لدينا بالفعل لوحة تصحيح مطبوعة على طابعة ثلاثية الأبعاد. لمدة يومين ، صنعنا نموذجًا أوليًا لجهاز من الحديد والمكتبات الجاهزة وبعض الأمهات ، يأخذ في الاعتبار الموظفين أو يسمح لك بالتحقق من مرور شخص عبر الباب الدوار من خلال مروره.
لا مال. استخدمنا فقط المصدر المفتوح.
يمكنك تكرار ذلك في 15-20 دقيقة باستخدام برنامجنا النصي.
نهج الفكرة والتنفيذ
بدأ كل شيء مع إقامة صيفية ، حيث استراحنا بعد الانتهاء من مشروع رئيسي واحد. كانت هناك لحظة عندما كان من الصعب للغاية ضرب البوابة بالمفتاح. بمعنى أننا اعتقدنا على الفور أنه من السيء إخراج أيدينا من جيوبنا في فصل الشتاء ، حسنًا ، توصلنا إلى مجموعة من التطبيقات الأخرى ، وصولًا إلى فحص تصاريح الموظفين والهويات.
في الواقع ، أردنا إنشاء ممر بأشعة الليزر ، كما في فيلم Resident Evil ، لكن لم يكن لدينا الوقت. بشكل عام ، أردت تأثير التفاعل مع النظام بحيث يستجيب أيضًا بصوت.
نظرًا لأننا أردنا نموذجًا أوليًا ، فإليك الحد الأقصى للتوجيه على الوظائف والنتائج السريعة على حساب المظهر والأبعاد والهندسة المعمارية الجميلة. اتضح أنه مخيف ، ولكن بسرعة ويعمل.
أولاً ، قمنا بتقسيم التحكم في الباب إلى وحدات وبدأ كل واحد في كتابة وحدته. كانت وحدة التعرف في اليوم الأول خارجية من خدمة الويب للشريك ، وكان لا يزال هناك محرك الشبكة العصبية الداخلية القديم من مشروع آخر ، بالإضافة إلى وجود حلول مفتوحة المصدر. ونتيجة لذلك ، فزنا بالمصدر المفتوح: لقد تطلب محركنا إعادة الهيكلة والتحديث (استغرق ذلك وقتًا طويلاً) ، وأراد مورد الويب الشريك المال ولم يسمح له بالدخول ، ولكن المصدر المفتوح هو مصدر مفتوح.
الإلكترونيات والإسكان
في البداية ، نظروا في خيار شراء قفل يتم التحكم فيه إلكترونيًا واستبداله بقفل باب داخلي قياسي. ولكن بسبب وجود زجاج مع مصاريع في الباب ، كان القفل الداخلي ضيقًا بشكل غير عادي ولم يكن هناك ببساطة استبدال إلكتروني في السوق. لذلك ، قام مهندسنا بطباعة قفل قابل للفصل ، مما يوفر حاويات لوحدة التحكم ووحدة فتح القفل فيها.
لذا فإن مشروع المبنى:
قمنا بطباعته من نموذج قمنا به قبل المشروع (استغرق التصميم والتركيب وقتًا أطول من كتابة الرمز):
تم تصميم العلبة بتصميم Compass-3D. ونتيجة لذلك ، قام ديما بعمل 3 إصدارات من القضية ، طالما كان قادرًا على اختيار الترتيب الأمثل للعناصر والسحابات.
داخل علبة القفل ، محرك MG-995 بقوة 10 كجم (قوة التحريك الحقيقية هي 5-7 كجم) ، زوج من أجهزة استشعار الأشعة تحت الحمراء للتحكم في التشغيل الآلي عند المدخل والخروج ، متحكم Esp8266 مع وحدة Wi-Fi و خادم ويب ، من أجل البساطة ، تلقى أوامر التحكم لفتح وإغلاق الأبواب عبر http. أدار جهاز التحكم نفسه تروس المفتاح.
الجزء البرمجي من وحدة التحكم الدقيقة مكتوب في C.
منغمسين في تفاصيل تصنيع العلبة والحشو ، فكرنا بشكل لا إرادي في تعقيد الأشياء التي تبدو بسيطة.
الإجمالي: يمكن لوحدة التحكم في القفل قبول أوامر الفتح عبر Wi-Fi.
جزء التعرف على الوجه
نحتاج إلى وحدة التعرف على الوجوه التي سترسل أمرًا "مفتوحًا" إلى القلعة إذا احتاج الأمر لفتحه. نظرًا للبنية المعيارية ، يمكن أن تعمل على خادم صغير في منزل ذكي أو أن تكون خدمة ويب على الإنترنت. نحتاج أيضًا إلى نقطة Wi-Fi في الشبكة المحلية مع وحدة التحكم في القفل: فهي إما عميل رفيع أو خادم منزلي. لقد نشرنا الخادم مباشرة على الكمبيوتر المحمول القديم ، أي أننا دمجنا الخادم والعميل الرقيق. قاموا بتوصيل الكاميرا بالكمبيوتر المحمول عبر USB.
للتعرف على نفسها ، توقفنا في
مكتبة Python للتعرف على الوجه بموجب ترخيص مفتوح من جامعة ماساتشوستس للتكنولوجيا.
تم تحميل العديد من الصور لكل مشارك في المشروع على النموذج - في المقدمة وفي الملف الشخصي وفي الطبيعة. من الناحية النظرية ، كلما زادت الصور التي تحمّلها إلى النموذج ، زادت دقتها ، ولكن في معظم الحالات هناك ما يكفي من الصور الرمزية من Facebook أو صور من قاعدة بيانات إيشارس.
قمنا بنشر البنية التحتية كخدمة في
Technoserv Cloud وتم تصحيح الأخطاء بسرعة. استغرق نشر جهاز افتراضي جديد مع جميع الخدمات 20 دقيقة. ثم قاموا بتحميل جميع التعليمات البرمجية مع المكتبات إلى كمبيوتر محمول يعمل من أجل عمل مستقل.
يختار النظام أكبر وجه في الإطار ويتعرف عليه مرتين بتردد 0.5 ثانية.
خرجت كاميرا الويب من صندوق الأشياء المنسية من التسعينات. ما كان بالفعل ، لكنه كان كافياً.
إجمالي وقت التعرف هو أكثر بقليل من ثلاث ثوان. هذا لأن الكمبيوتر المحمول قديم بالفعل ولا يحتوي على بطاقة فيديو. مع vidyuha وسرعة التعرف على كاميرا الويب ستزداد بشكل ملحوظ.
كتبوا على الفور موصلًا للتعرف على الصوت ، نظرًا لأن الوجه فقط غير موثوق به (المزيد عن ذلك لاحقًا) ، هناك عاملان ضروريان.
استغرق الأمر 6 ساعات لنموذج أولي تم تصحيحه أكثر أو أقل بعد اختيار مكتبة.
قمنا أيضًا بتوصيل مكبر صوت بلوتوث بالكمبيوتر المحمول حتى يتمكن من التحدث. تم إخفاء الكمبيوتر المحمول نفسه في خزانة برسائل شكر ، مثل جهاز مضمن.
الاختبارات
يقول وصف المكتبة: "تم بناؤه باستخدام
تقنية التعرف على الوجه
الأكثر حداثة في dlib المبنية مع التعلم العميق. "النموذج لديه دقة 99.38٪ على
الوجوه المصنفة في المعيار
البري ." بطبيعة الحال ، ليس هناك 99.38 ٪ ، ولكن أقل من ذلك بكثير. لأنك تحتاج إلى تحميل صور عادية (وأكثر) ، اضبط كاميرا عادية وقم بتعادل الضوء. ولكن نظرًا لأنك تحفر عند الباب ، فإنها تمكن من عمل 4-5 إطارات ، وعادةً ما يتم فتحها على الفور تقريبًا.
الأخطاء: ارتبك الباب بضع مرات ولم يسمح لنا بالذهاب على الفور. لا يمكن للغرباء من الإدارات الأخرى دخول الباب.
يمكنك عمل وجوه عند الباب ، فهي تفهم كل شيء وتفتح.
وفقا لصورة الموظف ، فإنه يفتح بالطبع. أضفنا وحدة التعرف على الشخص بالكامل في الإصدار التالي (خارج هذين اليومين) ، وبدأت في الفتح فقط إلى التمثال النصفي.
ثم قاموا بلف اختبار اللون (مكتبة الاختزال ويأخذ الصور بالأبيض والأسود في المعالجة) ، وحركات الوجه وامض - تحتاج إلى كاميرا أفضل لرؤية الشخص عندما لا يزال لائقًا ، وسيكون كل شيء.
هذا ، كبديل رئيسي ، بالطبع لا ، لأن هناك حاجة إلى عامل ثانٍ - على سبيل المثال ، الصوت. لكن مناسبة للأبواب غير النقدية. لحساب الموظفين الذين يمرون من الباب أيضا. للتحقق مما إذا كان الموظف يطابق تصريح المرور عند نقطة التفتيش أيضًا. يمكنك أيضًا التعرف على عودة الكلب إلى المنزل عند الباب. إذا كنت تتذكر تاريخ التعرف على الأنماط ، فإن أحد التطبيقات الصناعية الأولى هو أن المطور الأمريكي حصل على قطة جار ، حماقة في الحديقة. جعل التعرف على القط في شبه القرفصاء وربط نظام الري بخادمه المصغر. بعد يومين ، أدركت القطة أنه من الأفضل عدم الهراء. أبدا. لا مكان.
اتضح أن الحالة مستقبلية وضخمة ، في النسخة التجارية يجب ألا يكون هناك شيء على الباب على الإطلاق ، باستثناء كاميرا مزودة بميكروفون وشاشة صغيرة مزودة بمساعد مرئي وصوتي.
كرر في المنزل
رابط للمكتبة أعلاه.
في البرنامج النصي نفسه ، تتوافق أسماء الموظفين (Emp1 ، Emp2) مع الملفات التي تحتوي على صورهم في الدليل ، تحتاج إلى إضافة ملفاتك الخاصة. لا يهم الدقة ، يمكنك 640 × 480 على الأقل. هناك فئتان من الموظفين - المستهدفين ، الذين يجب تخطيهم ، وأولئك الذين يرسلون إلى المنزل على الفور.
ككاميرا ، استخدمنا أبسط كاميرا الويب لوجيتك. بدلاً من الكمبيوتر المحمول ، من الممكن جدًا استخدام متحكم دقيق ، لكنك تحتاج إلى فهم كيفية وضع الثعبان والمكتبات المحددة عليه.
النتيجة
لقد شعرت هذه التكنولوجيا من قبل البائعين من الإدارات المجاورة التي تعمل معنا في نفس الطابق. تبدو علبة القفل المتراكبة رائعة بشكل خاص ، وبأي صوت تفتح الباب! لا تصدق ذلك ، ولكن الترويج الداخلي للتكنولوجيا ضروري مثل الترويج الخارجي.
سئلنا عدة مرات لماذا فعلنا ذلك بعد ساعات.
الجواب لأنني أردت حقًا أن أسلّي رجالنا حتى يشعروا بالتقنيات التي نستخدمها على جهاز يعمل. لأنها نموذج أولي على الأجهزة والبرامج على الفور وهي جلسة تدريب صغيرة قبل المشاريع الأكبر. من غير المحتمل أن يتم استخدام النموذج الأولي في مكان ما ، ولكن له وظيفة تعليمية وأخلاق.
حسنًا ، لقد تأكدنا من مدى سرعة إنشاء النماذج الصناعية. عادة نقوم بتنفيذ مشاريع تجريبية سريعة (2-3 أسابيع) للإنتاج. بالمناسبة ، إذا كان من المثير للاهتمام حساب شيء بسرعة من حيث الأتمتة وإجراء تجربة - هذا هو مجرد تخصص لفريقنا.
راسل tmishin@technoserv.com إذا كان ذلك.
يبدو وكأنه بعد هاكاثون جيد.
والآن لدينا لعبة.
جاء زميل يعمل يوم أمس وعرض شريط فيديو
لطائرة بدون طيار مع قاذف اللهب . يبدو أن لدينا بعض الأفكار ...
أخبرت كل هذا أيضًا بحقيقة أنه قبل 3-4 سنوات حرفيا كان مكلفا للغاية وطويل كتابة أجهزة الكشف الصناعية للمراقبة بالفيديو. للتحكم في حجم جزء المواد على الحزام الناقل ، للتوقف في حالة وجود أجسام غريبة ، للإغلاق عند العمل في منطقة الخطر وما إلى ذلك. اليوم يتم ذلك بسرعة كبيرة جدا. وأرخص بكثير. ليس بسرعة الباب ، ولكن الطيار في أسبوعين هو تقدير واقعي للغاية.