في عام 2016 ، نظرًا للحلم الطويل الأمد لألعاب الفيديو و "الضجيج" حول الذكاء الاصطناعى ، بدأت أتعلم بيثون.
علوم الكمبيوتر ممتعة لأنه منذ أسبوع واحد فقط قمت بتدريب نموذج التعرف الأول ، لكن دون استخدام Python (توجد العديد من الإغراءات في علوم الكمبيوتر). كما توقع Andrei Sebrant (Yandex) ، فقد حان ثورة تكنولوجية جديدة. لماذا؟ جعل تطبيق التعرف على الصور أسهل من لعبة الكمبيوتر. يكفي لمدة ساعة أو ساعتين.

ذهبت بالطريقة "الصعبة" - لم أختر من بين أربعة نماذج مدربة بالفعل ، لكنني درّبت بنفسي. تتيح لك مكتبة Apple ML من Apple القيام بذلك من خلال 6 أسطر من التعليمات البرمجية أو من خلال واجهة المستخدم الرسومية في الملاعب.
import CreateMLUI let builder = MLImageClassifierBuilder() builder.showInLiveView()
قضى معظم الوقت في جمع وتصفية البيانات للتدريب ، و 70 صورة للكلاب والقطط والأشخاص ، ولكن النص المكتوب بسرعة ، جعل هذه العملية شبه تلقائية.
اعتدت أن أقرأ للتو عن التعلم الآلي. عندما جربتها بنفسي ، واجهت ثلاث مشاكل / استنتاجات متوقعة:
- البيانات هي الجزء الأكثر أهمية.
- واجهة سهلة الاستخدام (CoreML). كل شيء يعمل تمامًا ولا أريد حقًا الدخول إلى الكود المصدري لمعرفة التفاصيل. التعلم الآلي متاح لأي مستخدم ، لكن مهندسي Apple حاولوا إخفاء التفاصيل المعقدة.
- النموذج هو الصندوق الاسود. أنا لا أعرف القواعد التي يعتقد النموذج أن اثنين في المئة من "القط" في الصورة.
لقد أدت تجربة التعرف على "القطط البشرية" إلى فكرة أن خوارزمية التصنيف ستتعامل مع "النمط".
اخترت أربعة مصورين وحوالي مائة صورة من كل منهم. لم أحاول أن أختار الأمثلة بعناية ، لكن ببساطة قمت بنسخ من مجموعتي الصور الأولى أو الأخيرة المائة من
Evgeny Mokhorev و
Oleg Videnin . لم تكن هناك صور كافية لـ
Maxim Shumilin ، لأنه لم يتم اختيار صور فقط. لكن صور
Yegor Voinov تم اختيارها بعناية أكبر ، حيث قمت بتنزيل قسمين على الصورة على موقعه على الويب.
لقد بدأت في تدريب الخوارزمية وحصلت في المتوسط على دقة التعرف على 80٪ (نتائج الاختبار أثناء الإنشاء).
كان هناك لحظة واحدة غريبة. لقد ضاعفت عدد الصور بواسطة Oleg Videnin وتعلم النظام 30٪ فقط ، وانخفضت دقة التعرف إلى 20٪.
يجب فحص النظام من أجل تجنب التحيز بطريقة أو بأخرى ، طلبت من إيجور فوينوف إرسال الصور غير الموجودة على الموقع. نتيجةً لذلك ، أكدت الخوارزمية أن 20 صورة من أصل 26 تشبه طريقة التقاط صورة لـ Yegor Voinov.
أكد هذا دقة التعرف بنسبة 77٪ التي تم الحصول عليها عند إنشاء المصنف.

ثم يبدأ المرح.
أولاً ، يمكن تدريب النظام من خلال إعادة إضافة "الأخطاء" إلى مجموعة التدريب. تتغير النتائج ، لكن النظام لا يتذكر الصور ، ولكنه يجد علامات شائعة لمؤلف معين. تم التعرف على بعض الصور بعد "العمل على الأخطاء" من قبل النظام كصور لـ Yegor Voinov ، والبعض الآخر لم يكن كذلك.

ثانياً ، يميل النظام إلى عزو "عارية" إلى صور يفغيني موخورييف ، وبالتالي يكتب تحت "عارية" النادرة من أوليغ فيدينين أن هذه هي صور لمخوريف. وبمجرد أن تظهر "Mokhorev الملبس" ، يمكن للنظام "رؤية Voinov". تم التعرف على صورة ليغور فوينوف كصورة لأوليغ فيدينين.

تبين أن مجموعة مختارة من الصور الفوتوغرافية لمكسيم شوميلين غير متجانسة للغاية. لذلك ، فإن الشخصيات الصغيرة والصور مع "طمس" وضوحا للنظام يشير إلى صور مكسيم.

ثالثًا ، يمكن إعطاء النظام نظرة على صورة Master Yoda.
ويمكنك فقط التقاط صورة سريعة ومعرفة "أسلوب" التقاط الصورة
وها هي لحظة الحقيقة. لقد قمتُ بتحميل الصور الخاصة بي لمعرفة مقدار تواجدي في موخوريف وفيدينين وفوينوف وشوميلين.

مشروع
PhotoGuru التطبيق جاهز. يبدو لي حتى الآن أن هذه لعبة ممتعة ، لكنني سأعمل على تصميم وتوسيع عينات التدريب.
في كلمة واحدة ، تحتاج إلى اختيار إطار عمل لمزيد من الدراسة من ML.