بيتزا الذكاء الاصطناعي: كيف استخدمنا شبكتين عصبيتين متكررتين

يثير موضوع الشبكات العصبية قلوب المطورين والعلماء والمسوقين لأكثر من عام ، وبالنسبة للبعض حتى العقد الأول. لكننا نعلم جميعًا أنه في كثير من الأحيان ، في ظل المشروعات القائمة على الخلايا العصبية ، يوجد تاريخ كبير بسيط ونشرة تسويقية ، منتفخة على خلفية رأس clickbait. حاولنا تجنب مثل هذه القصة وقمنا بتطوير مشروع neuropizza استنادًا إلى دراسة التوافق الجزيئي للمكونات وتحليل 300 ألف وصفة وإبداع خالص. تحت القص ، يمكنك معرفة التفاصيل والعثور على الرابط المفتوح المصدر على جيثب.



هل يمكن لسيارة أن تأتي بشيء جديد أم أنها مقيدة بما تعرفه؟ حتى الآن ، لا أحد يعرف إجابة هذا السؤال. ولكن الآن ، الذكاء الاصطناعي يحل تماما مشاكل تحليل البيانات الكبيرة غير القياسية.

عندما وصلوا إلى Dodo Pizza ، قرروا إجراء تجربة: لتنظيم ما يصفه بالفوضى والذاتية في جميع أنحاء العالم ، وهو ما يصفه بطريقة منهجية ويصفها بطريقة هيكلية. ساعد الذكاء الاصطناعي في إيجاد أكثر مجموعات المكونات جنونا ، والتي ، على الرغم من طبيعتها غير العادية ، تبين أنها لذيذة لمعظم الناس.

لقد عملت أنا وزميلي كمتخصصين في الشبكات العصبية من MIPT و Skoltech في هذا المشروع غير العادي. قمنا بتطوير وتدريب شبكة عصبية يمكنها حل مشكلة توليد وصفات المطبخ. في أثناء العمل ، تم تحليل أكثر من 300000 وصفة ، وكذلك نتائج البحث العلمي على التوافق الجزيئي للمكونات. على هذا الأساس ، تعلمت منظمة العفو الدولية إيجاد صلات غير واضحة بين المكونات وفهم كيفية تمازجها مع بعضها البعض وكيف يؤثر وجود كل منها على توافق جميع المكونات الأخرى.

كيف وصلنا إلى مشروع دودو للبيتزا


كل شيء ، كما يحدث عادة ، حدث فجأة. كانت هناك فترة مهلة قصيرة قبل الممارسة الصيفية ، انتهينا للتو من دورة التعلم العميق ، ودافعنا عن المشروع وحاولنا التكيف مع إيقاع أكثر استرخاء في الدراسة / الحياة. لكنهم لم يتمكنوا من ذلك: صادفوا عن طريق الخطأ إعادة النشر في طلب شخصي من BBDO حول إيجاد أشخاص يمكنهم كتابة شبكة عصبية لإنشاء وصفات جديدة. بشكل أكثر تحديدا: وصفات بيتزا جديدة لدودو. دون تردد ، قررنا أننا نريد أن نحاول.

عندما كان المشروع قد بدأ لتوه ، لم نفهم تمامًا ما إذا كان سيستمر إلى أبعد من ذلك ، وما إذا كان سيكون هناك تنفيذ عملي ، فقد كنا مهتمين بالمهمة. ساعد الكثير من redbowl والإنترنت السريع ودفعنا إلى الأمام. إذا نظرنا إلى الوراء ، نفهم أن بعض الأشياء يمكن القيام بها بطريقة مختلفة ، ولكن هذا أمر طبيعي.

على أي حال ، بعد بضعة أسابيع كان نموذج عمل الشبكة العصبية جاهزًا ، بدأت مرحلة إطلاقه في الإنتاج. نحن محظوظون للغاية لأنه لا يمكن تسمية المشروع صناعيًا أو تقنيًا بالمعنى الدقيق للكلمة التالية. حالة التجربة أكثر ملاءمة له.

باستخدام نموذجنا ، تم إنشاء أنواع مختلفة من وصفات البيتزا ، والتي انتقلنا إليها بين أيدي طهاة Dodo الرائعين للغاية لإجراء اختبارات المنتج. كانت لحظة تذوق البيتزا في مختبر دودو للبحث والتطوير نقطة تحول من حيث إدراك قيمة العمل الذي قمنا به. كان مثيرا للغاية أن نرى المنتج يباع. في الواقع ، غالبًا ما تكون كل الحلول والحلول أمرًا سريعًا إلى حد ما ، وغير ملموس ، وهنا لا يمكن لمس هذه النتيجة فحسب ، بل أيضًا تذوقها.

مجموعة أولية من مجموعة البيانات والفلفل الحار


أي نموذج يحتاج البيانات للعمل. لذلك ، لتدريب الذكاء الاصطناعي لدينا ، جمعنا 300000 وصفة من جميع المصادر المتاحة. كان من المهم بالنسبة لنا أن نجمع ليس فقط وصفات البيتزا ، ولكن أيضًا تنويع التحديد بأكبر قدر ممكن ، مع محاولة عدم تجاوز المعقول (على سبيل المثال ، تجاهل وصفات الكوكتيل ، مع إدراك أن دلالاتها لن تؤثر بشكل كبير على دلالات وصفات البيتزا).

بعد جمع البيانات ، حصلنا على أكثر من 100،000 عنصر فريد. كانت المشكلة الكبيرة هي نقلهم إلى شكل واحد. ولكن من أين أتى الكثير من العناصر؟ كل شيء بسيط ، على سبيل المثال ، يشار الفلفل الحار في وصفات مثل هذا: الفلفل الحار ، الفلفل الحار ، الفلفل الحار ، الفلفل الحار. من الواضح لك أن هذا هو نفس الفلفل ، لكن الشبكة العصبية ترى هجاء مختلفًا ككيانات منفصلة. نحن إصلاحه. بعد قيامنا بتنظيف البيانات وعرضها على عرض واحد ، لم يتبق لدينا سوى 1000 وظيفة.

تحليل العالم الأذواق


بعد تلقينا مجموعة البيانات جاهزة للعمل ، أجرينا التحليل الأولي. أولاً ، نظرنا إلى أي المطابخ في العالم ممثلة في مجموعة البيانات الخاصة بنا بنسبة كمية.



لكل من المأكولات ، حددنا المكونات الأكثر شعبية.



في هذه الرسوم البيانية ، هناك اختلافات ملحوظة في تفضيلات ذوق الأشخاص حسب البلد. كما يتضح من هذه التفضيلات كيف يجمع الأشخاص من مختلف البلدان المكونات مع بعضهم البعض.

نتائج البيتزا اثنين


بعد هذا التحليل العالمي ، قررنا دراسة وصفات البيتزا من جميع أنحاء العالم بمزيد من التفاصيل للعثور على أنماط في تكوينها. فيما يلي الاستنتاجات التي توصلنا إليها:

  1. وصفات البيتزا هي طلبية أصغر من وصفات اللحوم / الدجاج والحلويات.

  2. العديد من المكونات الموجودة في وصفات البيتزا محدودة. تباين المنتجات أقل بكثير مما كانت عليه في الأطباق الأخرى.


كيف اختبرنا النموذج


العثور على مجموعات نكهة حقيقية ليس هو نفسه الكشف عن توافق الجزيئات. جميع الأجبان لها تركيبة جزيئية مماثلة ، لكن هذا لا يعني أن التركيبات الناجحة تكمن فقط في منطقة أقرب المكونات.



ومع ذلك ، يجب أن نرى بالضبط توافق المكونات المماثلة للمستوى الجزيئي عندما نترجم كل شيء إلى رياضيات. لأن الأجسام المتشابهة (نفس الأجبان) يجب أن تظل متشابهة ، بغض النظر عن كيفية وصفها. لذلك يمكننا تحديد تلك الموصوفة هذه الكائنات بشكل صحيح.

تحويل وصفة إلى الرياضيات


لتقديم الوصفة في شكل مفهوم للشبكة العصبية ، استخدمنا Skip-Gram Sampling Sampling (SGNS) - خوارزمية word2vec ، والتي تستند إلى حدوث الكلمات في السياق. قررنا عدم استخدام نماذج word2vec المدربة مسبقًا ، لأن وصفتنا تختلف بوضوح في البنية الدلالية عن النصوص البسيطة. باستخدام هذه النماذج ، قد نفقد المعلومات الهامة.

يمكنك تقييم نتيجة word2vec من خلال النظر إلى أقرب الجيران الدلالي. على سبيل المثال ، إليك ما يعرفه نموذجنا عن الجبن:



لاختبار مدى قدرة النماذج الدلالية على التقاط تفاعلات وصفة المكونات ، قمنا بتطبيق نموذج نمذجة مواضيعية لجميع الوصفات من العينة. أي أنهم حاولوا تقسيم مجموعة بيانات الوصفات إلى مجموعات وفقًا للأنماط المحددة رياضياً.



مع العلم مقدما أن عينة معينة من الوصفات تنتمي إلى فئات حقيقية مختلفة تم الحصول عليها من البيانات ، قمنا ببناء توزيع الانتماء لكل فئة حقيقية إلى تلك التي تم إنشاؤها.



الأكثر وضوحا هو فئة الحلويات ، التي شكلت السمة 0 و 1 ، والتي تم إنشاؤها بواسطة النموذج المواضيعي. بالإضافة إلى الحلويات ، لا تكاد توجد فصول أخرى في هذه الموضوعات ، مما يوحي بأن الحلويات مفصولة بسهولة عن فئات أخرى من الأطباق. أيضا في كل موضوع هناك فئة تصفها بشكل أفضل. وهذا يعني أن نماذجنا تعاملت جيدًا مع الوصف الرياضي للمعنى غير الواضح لـ "الذوق".

وصفة الجيل


لإنشاء وصفات جديدة ، استخدمنا شبكتين عصبيتين متكررتين. للقيام بذلك ، اقترحنا أنه في الفضاء المشترك للوصفات ، توجد مساحة فرعية مسؤولة عن وصفات البيتزا. من أجل أن تتعلم الشبكة العصبية وصفات بيتزا جديدة ، كان علينا إيجاد هذه المساحة الفرعية.

تشبه هذه المهمة معنى تشفير الصور عندما نقدم صورة كمتجه ذي البعد الصغير. في هذه الحالة ، قد تحتوي المتجهات على كمية كبيرة من المعلومات المحددة حول الصورة.

على سبيل المثال ، للتعرف على الوجوه في الصورة ، يمكن لهذه المتجهات تخزين معلومات حول لون الشعر البشري في خلية منفصلة. لقد اخترنا هذا النهج على وجه التحديد بسبب الخصائص الفريدة للمساحة الفرعية المخفية.

لتحديد مساحة البيتزا الفرعية ، قمنا بتشغيل الوصفات من خلال شبكتين عصبيتين متكررتين. تلقى أول واحد وصفة البيتزا عند المدخل وبحثت عن تمثيلها في شكل ناقلات خفية. تلقت الثانية ناقلات خفية من الشبكة العصبية الأولى واضطررت إلى تقديم وصفة بناءً عليها. يجب أن تتزامن الوصفات عند إدخال الشبكة العصبية الأولى وعند إخراج الشبكة الثانية.

لذلك تعلمت شبكتان عصبيتان في صيغة فك تشفير التشفير أن تنقل الوصفة بشكل صحيح إلى متجه مخفي (كامن) والعكس صحيح. بناءً على ذلك ، تمكنا من اكتشاف مساحة فرعية مخفية مسؤولة عن جميع وصفات البيتزا العديدة.





التوافق الجزيئي


عندما حلنا مشكلة إنشاء وصفة البيتزا ، كان علينا إضافة معيار التوافق الجزيئي إلى النموذج. لهذا ، استخدمنا نتائج دراسة مشتركة لعلماء من كامبريدج والعديد من الجامعات الأمريكية.

نتيجة للدراسة ، وجد أن المكونات التي تحتوي على أكبر عدد من الأزواج الجزيئية هي أفضل مزيج. لذلك ، عند إنشاء الوصفة ، فضلت الشبكة العصبية المكونات ذات البنية الجزيئية المشابهة.

النتيجة و AI بيتزا


نتيجة لذلك ، تعلمت شبكتنا العصبية إنشاء وصفات البيتزا بنجاح. عن طريق ضبط المعاملات ، يمكن لمنظمة العفو الدولية إنتاج كل من الوصفات الكلاسيكية (مثل مارغريتا أو بيبروني) ، وصفات مجنونة. شكلت هذه الوصفة المجنونة أساس أول بيتزا مثالية جزيئيًا في العالم مع عشرة مكونات: صلصة الطماطم والبطيخ والكمثرى والدجاج وطماطم الكرز والتونة والنعناع والبروكلي والجبن الموزاريلا والجرانولا. يمكن شراء نسخة محدودة في أحد مطاعم دودو. وإليك بعض الوصفات الأكثر إثارة والتي يمكنك محاولة طهيها في المنزل:

  • سبانخ ، جبنة ، طماطم ، زيتون أسود ، زيتون ، ثوم ، فلفل ، ريحان ، حمضيات ، بطيخ ، تنبت ، زبدة لبن ، ليمون ، باس ، جوز ، روتاغا ؛
  • بصل ، طماطم ، زيتون ، فلفل أسود ، خبز ، عجين ؛
  • دجاج ، بصل ، زيتون أسود ، جبنة ، صلصة ، طماطم ، زيتون ، جبن موزاريلا
  • طماطم ، زبدة ، كريمة ، فلفل ، زيتون ، جبنة ، فلفل أسود ، جبن موزاريلا

كل هذا سيكون قمامة إذا لم نعط رابط إلى الأكثر إثارة للاهتمام:

Source: https://habr.com/ru/post/ar471650/


All Articles