قبل أن يتمكن العميل من إجراء تحويلات مالية في ePayments ، سيتعين عليه إجراء التحقق. يزودنا ببياناته الشخصية ويحمل الوثائق للتحقق من هويته وعنوانه. ونتحقق مما إذا كانت تلبي متطلبات منظمتنا. أصبح تدفق طلبات التحقق أكثر فأكثر ، وأصبح من الصعب علينا معالجة مثل هذا التدفق من المستندات. كنا نخشى أن يستغرق الإجراء الكثير من الوقت ويتجاوز جميع الشروط المعقولة للعملاء. ثم قررنا إنشاء نظام تحقق يعتمد على التعلم العميق.

برنامج تعليمي عن المنظمين ومتطلباتهم
لإصدار النقود الإلكترونية ، تحتاج إلى الحصول على ترخيص منظم. إذا فتحت نظام دفع ، على سبيل المثال ، في روسيا ، سيصبح البنك المركزي للاتحاد الروسي منظمًا لك. ePayments هو نظام دفع باللغة الإنجليزية ، والمنظم لدينا هو هيئة السلوك المالي (FCA) ، وهي هيئة مسؤولة عن وزارة الخزانة البريطانية. تضمن FCA التزامنا بسياسة مكافحة غسيل الأموال (AML) ، والتي تتضمن مجموعة إجراءات اعرف عميلك (KYC).
وفقًا لـ KYC ، نحن ملتزمون بالتحقق من هوية عميلنا وما إذا كان مرتبطًا بمجموعات خطيرة اجتماعيًا. لذلك ، لدينا التزامان:
- تحديد وتأكيد هوية العميل.
- مطابقة بياناته مع قوائم مختلفة: إرهابيون ، أشخاص خاضعون للعقوبات ، أعضاء في الحكومة والعديد من الآخرين.
في كل عام ، تصبح متطلبات KYC أكثر صرامة وأكثر تفصيلاً. في بداية عام 2017 ، كان لا يزال بإمكان عملاء الدفع الإلكتروني تلقي المدفوعات أو إجراء التحويلات دون التحقق. الآن هذا غير ممكن حتى يؤكدوا هويتهم.
التحقق اليدوي
قبل بضع سنوات ، تمكنا من القيام بمفردنا. أرسل الروس مسحًا لصفحات معينة من جواز السفر لتأكيد هويتهم ، ومسحًا لاتفاقية عقد الإيجار ، وإيصال لدفع رسوم السكن والخدمات المجتمعية لتأكيد العنوان. تذكر أوراق اللعبة ، من فضلك؟ في ذلك ، أثناء اللعب كضابط جمارك ، تقوم بفحص المستندات بحثًا عن المتطلبات الحكومية المعقدة بشكل متزايد. لعب قسم العملاء لدينا في العمل كل يوم.

يتم التحقق من العملاء عن بعد ، دون زيارة إلى المكتب. لتسريع الإجراء ، قمنا بتعيين موظفين جدد ، ولكن هذا طريق مسدود. ثم جاءت الفكرة لشحن جزء من عمل الشبكة العصبية. إذا تعاملت بشكل جيد مع التعرف على الوجه ، فإنها تتكيف مع مهامنا. من منظور الأعمال ، يجب أن يكون نظام التحقق السريع قادرًا على:
- تصنيف وثيقة. لقد تم إرسال بطاقة هوية وتأكيد عنوان الإقامة. يجب أن يجيب النظام على ما استلمه عند المدخل: جواز سفر مواطن من الاتحاد الروسي ، أو عقد إيجار أو أي شيء آخر.
- قارن الوجه في الصورة والمستند. نطلب من العملاء إرسال صور شخصية ببطاقة هوية للتأكد من أنهم هم أنفسهم مسجلين في نظام الدفع.
- استخرج النص. ملء عشرات الحقول من الهاتف الذكي ليس مناسبًا جدًا. من الأسهل بكثير إذا قام التطبيق بكل شيء من أجلك.
- تحقق من ملفات الصور لمونتاج الصور. يجب ألا ننسى المحتالين الذين يريدون الدخول إلى النظام بشكل احتيالي.
عند الإخراج ، يجب أن يشير النظام إلى مستوى معين من الثقة في العميل: مرتفع أو متوسط أو منخفض. بالتركيز على مثل هذا التدرج ، سوف نتحقق بسرعة من العملاء لفترات طويلة ولا نغضبهم.
مصنف الوثيقة
تتمثل مهمة هذه الوحدة في التأكد من أن المستخدم يرسل مستندًا صالحًا ويعطي إجابة عما قام بتحميله بالضبط: جواز سفر مواطن من كازاخستان ، أو عقد إيجار أو إيصال بدفع تكاليف السكن والخدمات المجتمعية.
يستقبل المصنف بيانات الإدخال:
- مستند صور أو مسح ضوئي
- بلد الإقامة
- نوع المستند الذي يشير إليه العميل (بطاقة الهوية أو إثبات العنوان)
- نص مستخرج (المزيد عن ذلك أدناه)
عند الإخراج ، يُصنف المصنف ما حصل عليه (جواز السفر ، رخصة القيادة ، وما إلى ذلك) ومدى ثقته في الإجابة الصحيحة.

يتم تشغيل الحل الآن على بنية شبكة واسعة المتبقية. لم نأت إليها على الفور. عملت النسخة الأولى من نظام التحقق السريع على أساس الهندسة المعمارية التي ألهمتنا VGG بها. كان لديها مشكلتان واضحتان: عدد كبير من المعلمات (حوالي 130 مليون) وعدم الاستقرار في موقع الوثيقة. كلما زادت المعلمات ، كلما كان من الصعب تدريب مثل هذه الشبكة العصبية - فهي تعمم المعرفة بشكل سيئ. يجب أن يكون المستند في الصورة في المنتصف ، وإلا سيتعين على المصنف أن يتدرب على العينات الموجودة في أجزاء مختلفة من الصورة. ونتيجة لذلك ، تخلينا عن VGG وقررنا التحول إلى بنية مختلفة.
كانت الشبكة المتبقية (ResNet) أكثر برودة من VGG. بفضل
تخطي الاتصالات ، يمكنك إنشاء عدد كبير من الطبقات وتحقيق دقة عالية. تمتلك ResNet حوالي 1 مليون معلمة فقط ، وكانت غير مبالية بموقف المستند. بغض النظر عن مكان وجوده في الصورة ، تعامل الحل على هذه الهندسة مع التصنيف.
بينما كنا ننهي الحل بملف ، تم إصدار تعديل جديد في الهندسة المعمارية ، شبكة واسعة المتبقية (WRN). الفرق الرئيسي من ResNet هو خطوة إلى الوراء من حيث العمق. يحتوي WRN على طبقات أقل ، ولكن المزيد من المرشحات التلافيفية. الآن هذه هي أفضل بنية شبكة عصبية لمعظم المهام ويعمل حلنا عليها.
بعض الحلول المفيدة
المشكلة رقم 1. يحتاج المصنف إلى التدريب. كان علينا تنزيل الكثير من جوازات السفر الروسية والكازاخستانية والبيلاروسية ورخص القيادة. ولكن ، بالطبع ، لا يمكنك أخذ وثائق العملاء. هناك عينات على الشبكة ، ولكن هناك عدد قليل جدًا منها لتدريب الشبكة العصبية بنجاح.
الحل. أنتج قسمنا الفني عينة من أكثر من 8000 عينة من كل نوع. نقوم بإنشاء قالب مستند ونضربه بالعديد من العينات العشوائية. ثم نقوم بإنشاء موضع عشوائي للمستند في الفضاء بالنسبة للكاميرا ، مع مراعاة نموذجها وخصائصها الرياضية: الطول البؤري ، ودقة المصفوفة ، وما إلى ذلك. عند إنشاء صورة مصطنعة ، يتم تحديد صورة عشوائية من مجموعة البيانات النهائية كخلفية. بعد ذلك ، يتم وضع مستند به تشوهات منظور على الصورة بشكل عشوائي. في مثل هذه العينة ، كانت شبكتنا العصبية مدربة تدريباً جيداً وحددت الوثيقة "في المعركة". النتائج في نهاية المقال.
المشكلة رقم 2. تقييد عادي على موارد الحوسبة والذاكرة. لا معنى لتقديم شبكة عصبية عميقة لإدخال الصور الكبيرة. والصور من الهواتف الذكية الحديثة هي فقط.
الحل. قبل التقديم على الإدخال ، يتم ضغط الصورة بحجم 300 × 300 بكسل تقريبًا. من صورة هذا الإذن ، يمكن للمرء بسهولة تمييز وثيقة تعريف واحدة عن أخرى. لحل هذه المشكلة ، يمكننا استخدام بنية Wide ResNet القياسية.
المشكلة رقم 3. مع الوثائق التي تؤكد عنوان الإقامة ، كل شيء أكثر تعقيدًا. لا يمكن تمييز عقد الإيجار أو كشف الحساب إلا عن طريق النص على الورقة. بعد تقليل حجم الصورة إلى 300 × 300 بكسل ، فإن أي من هذه المستندات تبدو متشابهة - مثل ورقة A4 بنص غير مقروء.
الحل. لتصنيف المستندات التعسفية ، قمنا بإجراء تغييرات على بنية الشبكة العصبية نفسها. ظهرت فيه طبقة إدخال إضافية من الخلايا العصبية ، والتي ترتبط بطبقة الإخراج. تتلقى الخلايا العصبية في طبقة الإدخال هذه إدخالاً متجهًا يصف النص الذي تم التعرف عليه سابقًا باستخدام نموذج
حقيبة الكلمات .
أولاً ، قمنا بتدريب شبكة عصبية لتصنيف وثائق الهوية. استخدمنا أوزان الشبكة المدربة عند تهيئة شبكة أخرى بطبقة إضافية لتصنيف المستندات العشوائية. كان هذا الحل عالي الدقة ، ولكن التعرف على النص استغرق بعض الوقت. يمكن رؤية الفرق في سرعة المعالجة بين الوحدات المختلفة ودقة التصنيف في الجدول رقم 2.
التعرف على الوجه
كيف تخدع نظام الدفع الذي يتحقق من المستندات؟ يمكنك استعارة جواز سفر شخص آخر والتسجيل باستخدامه. للتأكد من تسجيل العميل لنفسه ، نطلب منك التقاط صورة ذاتية ببطاقة هوية. ويجب أن تقارن وحدة التعرف الوجه بين المستند والوجه على الصورة الذاتية والإجابة ، فهذا شخص واحد أو شخصان مختلفان.
كيف تقارن وجهين إذا كنت سيارة وتفكر مثل سيارة؟ تحويل صورة إلى مجموعة من المعلمات ومقارنة قيمها مع بعضها البعض. هذه هي الطريقة التي تعمل بها الشبكات العصبية التي تتعرف على الوجوه. يأخذون صورة ويحولونها إلى متجه 128-الأبعاد (على سبيل المثال). عندما ترسل صورة وجه أخرى إلى المدخلات وتطلب منهم المقارنة ، ستحول الشبكة العصبية الوجه الثاني إلى متجه وتحسب المسافة بينهما.
الجدول 1. مثال لحساب الفرق بين المتجهات في التعرف على الوجوه. يختلف ستيف بوسكيمي عن نفسه في صور مختلفة بنسبة 0.44. ومن جنيفر أنيستون - بمتوسط 1.33.بالطبع ، هناك اختلافات بين كيف يبدو الشخص في الحياة وعلى جواز السفر. اخترنا أيضًا المسافة بين المتجهات واختبرها على أناس حقيقيين لتحقيق نتيجة. في أي حال ، سيتم اتخاذ القرار النهائي الآن من قبل الشخص ، وسيكون تعليق من النظام مجرد توصية.
التعرف على النص
هناك حقول نصية في المستندات تساعد المصنف على فهم ما هو أمامه. سيكون من الملائم للمستخدم إذا تم نقل النص من نفس جواز السفر تلقائيًا وليس من الضروري كتابته يدويًا ، ومن قبله ووقت إصداره. للقيام بذلك ، قمنا بعمل الوحدة التالية - التعرف واستخراج النص.
في بعض الوثائق ، على سبيل المثال ، جوازات السفر الجديدة للاتحاد الروسي توجد منطقة يمكن قراءتها آليًا (MRZ). بمساعدتها ، من السهل أخذ المعلومات - من السهل قراءة النص الأسود على خلفية بيضاء ، يسهل التعرف عليه. بالإضافة إلى ذلك ، تحتوي MRZ على تنسيق معروف ، وبفضله يسهل الحصول على البيانات اللازمة.

إذا كانت المهمة تحتوي على مستندات مع MRZ ، فسيصبح ذلك أسهل بالنسبة لنا. تكمن العملية برمتها في مجال رؤية الكمبيوتر. إذا لم تكن هذه المنطقة موجودة ، فبعد التعرف على النص تحتاج إلى حل مشكلة واحدة مثيرة للاهتمام - لفهم ، وما هي المعلومات التي تعرفنا عليها؟ على سبيل المثال ، "15 مايو 1999" هو تاريخ الميلاد أو تاريخ الإصدار؟ في هذه المرحلة ، يمكنك أيضًا ارتكاب خطأ. MRZ جيد لأنه تم فك ترميزه بشكل فريد. نحن نعلم دائمًا ما هي المعلومات وأي جزء من MRZ للبحث عنه. انها مريحة جدا بالنسبة لنا. لكن MRZ لم تكن على الوثيقة الأكثر شعبية التي ستعمل بها الشبكة - جواز السفر للاتحاد الروسي.
للتعرف على النص ، كنا بحاجة إلى حل فعال للغاية. يجب إزالة النص من الصورة التي تم التقاطها بواسطة كاميرا الهاتف وليس من قبل المصورين المحترفين. اختبرنا Google Tesseract والعديد من الحلول المدفوعة. لم يأت شيء - سواء كان يعمل بشكل سيئ ، أو كان مكلفًا بشكل غير معقول. ونتيجة لذلك ، بدأنا في تطوير حلنا الخاص. الآن نحن ننهي اختباره. يظهر الحل نتائج لائقة - يمكنك القراءة عنها أدناه. سنتحدث عن الوحدة النمطية للتحقق من مونتاج الصور بعد ذلك بقليل ، عندما تكون هناك نتائج بحث دقيقة على عينات الاختبار و "المعركة".
النتيجة
يتم حاليًا اختبار النظام على قطاع التطبيقات للتحقق من روسيا. يتم تحديد المقطع عن طريق أخذ عينات عشوائية ، ويتم حفظ النتائج والتحقق منها وفقًا لقرارات مشغل قسم العميل لعميل معين.
البلد | نوع المصنف | الدقة | وقت العمل ، ق |
روسيا | البطاقة الشخصية | 99.96٪ | 0.41 |
روسيا | مستند مخصص | 98.62٪ | 6.89 |
كازاخستان | البطاقة الشخصية | 99.51٪ | 0.47 |
كازاخستان | مستند مخصص | 97.25٪ | 7.66 |
روسيا البيضاء | البطاقة الشخصية | 98.63٪ | 0.46 |
روسيا البيضاء | مستند مخصص | 98.63٪ | 9.66 |
الجدول 2. دقة مصنف الوثائق (التصنيف الصحيح للوثيقة بالمقارنة مع تقييم عامل التشغيل).واحدة من المزايا الرائعة للتعلم الآلي هي أن الشبكة العصبية تتعلم حقًا وترتكب أخطاء أقل. سرعان ما ننتهي من اختبار الجزء ونبدأ نظام التحقق في وضع "القتال". 30٪ من طلبات التحقق تأتي إلى ePayments من روسيا وكازاخستان وبيلاروسيا. وفقًا لتقديراتنا ، سيساعد الإطلاق على تقليل الحمل على قسم العملاء بنسبة 20-25 ٪. في المستقبل ، يمكن توسيع نطاق الحل ليشمل البلدان الأوروبية.
هل تبحث عن عمل؟
نحن نبحث عن موظفين للعمل في مكتب في سانت بطرسبرغ. إذا كنت مهتمًا بمشروع دولي به مجموعة كبيرة من المهام الطموحة ، فنحن في انتظارك. ليس لدينا ما يكفي من الناس الذين لا يخشون إدراكهم. أدناه ستجد روابط إلى الوظائف الشاغرة على hh.ru.