يستخدم برنامج Telegram برنامج IBM Watson للتعرف على القطط

مرحبًا

في هذه المقالة سأخبرك كيف تمكنت من كتابة روبوت يستخدم كل قوة الشبكات العصبية IBM Watson لتحديد وجود القطط في الصورة.

الصورة


في أبريل الماضي ، عندما علمت بمسابقة BotPrize ، قررت أن أحاول كتابة بعض برامج الروبوت.
اخترت لغة C # ومكتبة رائعة من MrRoundRobin
كلغة برمجة ، استخدمت PostgreSql كقاعدة بيانات.

كان أول روبوت لي حول موضوع تنزيل الملفات إلى موقع استضافة الملفات الشهير mega.nz.

ولكن كموضوع تالي ، اخترت القطط. باستخدام الروبوت ، يمكنك وضع إبداءات الإعجاب / عدم الإعجاب بالأختام الموجودة بالفعل في قاعدة البيانات وإرسال صور الأختام للإشراف. أيضًا في الوضع المضمن ، يمكنك إرسال أصدقائك إلى القطط الأكثر ولاءً.

وهكذا ، بعد تنفيذ الاعتدال يدويًا ، اعتقدت أنها مملة ، ويمكنك استخدام شبكة عصبية ، والتي ستحدد نفسها إذا كانت هناك قطة في الصورة أم لا.

بعد بحث قصير ، اكتشفت أن IBM Watson وواجهة برمجة تطبيقات Visual Recognition الخاصة بها يمكنها القيام بذلك.

الصورة

اتضح أن الأمر بسيط جدًا - أرسل الصورة للمعالجة واستجابة لذلك ، تحصل على مجموعة JSON لما وجده IBM Watson في هذه الصورة.

مثال Json
[
{
«classes»: [
{
«class»: «animal»,
«score»: 0.997762,
«type_hierarchy»: "/animals"
},
{
«class»: «mammal»,
«score»: 0.995504,
«type_hierarchy»: "/animals/mammal"
},
{
«class»: «cat»,
«score»: 0.990987,
«type_hierarchy»: "/animals/pets/cat"
},
{
«class»: «kitten»,
«score»: 0.668188,
«type_hierarchy»: "/animals/pets/kitten"
}
],
«classifier_id»: «default»,
«name»: «default»
}
]

وفقًا لذلك ، إذا كان هناك قطة في JSON مع احتمال أكثر من 0.75 ، فسيتم تنسيق هذه الصورة تلقائيًا. إذا لم يكن كذلك ، يتم إرساله إلى الفرن للإشراف اليدوي. لقد قمت بالتعبئة الأولية لقاعدة البيانات باستخدام موقع thecatapi ومعالجة حوالي 400 من الأختام لم تستغرق أكثر من 5 دقائق.

يمكنك محاولة إرسال صور مختلفة إلى IBM Watson هنا.

كانت الصعوبة الوحيدة التي واجهتها عند التسجيل في وحدة تحكم Bluemix هي أنها كانت معلقة طوال الوقت.

تمكنت من الاشتراك من خلال موقع developerworks من خلال تحديد المربع "أريد استخدام IBM Bluemix".

بعد ذلك ، حصلت على المفتاح من Visual Recognition API وتدربت على تقديم الطلبات في Explorer API

شهر استخدام واجهة برمجة التطبيقات Visual Recognition API مجاني ، ثم يتم تضمين الحد اليومي البالغ 250 صورة في اليوم. ومع ذلك ، فإن سعر دفع 2 دولارًا مقابل 1000 صورة يلهم التفاؤل الكبير.

لقد أحببت حقًا فكرة الحصول على حاسوب Watson العملاق للتعرف على القطط في الصورة بدلاً مني.

لدى IBM عدد كبير من واجهات برمجة التطبيقات والخدمات الأخرى وهناك مجال كبير للتكامل مع Telegram.

Source: https://habr.com/ru/post/ar397157/


All Articles