تقليل وقت الحوسبة من بضع سنوات إلى دقائق. فهم تعلم آلة الكم

لقد كنت مهتمًا بالحوسبة الكمومية منذ فترة طويلة وأكتب برامج لأجهزة الكمبيوتر الكمومية IBM Q Experience التي تبلغ مدتها 5 و 14 كيلوبايت. سأتحدث اليوم عن التقنيات التي يمكن تطبيقها في التعلم الآلي بعد أن احتلت الحوسبة الكمية العالم. المفسد للعلماء التاريخ: في المستقبل ، لن تكون قادرة على إطلاق النموذج وترك لشرب القهوة لمدة نصف يوم. ينقر الكمبيوتر الكمومي على مهام التعلم الآلي في آن واحد ، والأعذار مثل "تعلم النماذج" لم تعد تعمل. سيكون من الضروري إطلاق ليس طرازًا واحدًا ، بل مليونًا على الأقل.

صورة

لقد سمع الكثيرون أنه بمساعدة أجهزة الكمبيوتر الكمومية ، يستطيع مجرمو الإنترنت اقتحام أنظمة التشفير الحديثة. على عكس أجهزة الكمبيوتر الكلاسيكية ، التي تمثل RSA وخوارزميات التشفير المماثلة عائقًا جيدًا أمام القرصنة ، تجد أجهزة الكمبيوتر الكمومية عوامل بسيطة في غضون دقائق. هذا يعني أن المعلومات التي يتم اعتراضها من قبل المتسللين سيتم فك تشفيرها عاجلاً أم آجلاً.

بالطبع ، تخيف بعض هذه التطبيقات من أجهزة الكمبيوتر الكمومية. في هذه المقالة ، سوف نركز على الجانب الإيجابي وسنفكر في الحوسبة الكمية التي ستكون قادرة على إعطاء مجال جديد لمجال مثل التعلم الآلي.

ما هو تعلم آلة الكم وما هو الفرق من التقليدية


في أجهزة الكمبيوتر الحديثة ، بما في ذلك التعلم الآلي ، يتم إجراء العمليات الحسابية باستخدام وحدات البت الكلاسيكية. في أجهزة الكمبيوتر الكمومية ، التي اكتسبت شعبية مؤخرًا وتتطور بفعالية ، يتم استخدام وحدات البت من نوع خاص - وحدات البت الكمية أو وحدات البت المختصرة.

بالنسبة للبتة الكلاسيكية ، هناك حالتان - 0 و 1 ، بينما بالنسبة للعدد الباكر ، يكون عدد لا حصر له من توليفات من حالتين - هو ما يسمى التراكب. إذا كانت قطة Schrödinger من تجربة فكرية معروفة ، قبل أن تفتح ، حية وموتة في نفس الوقت ، فيمكن أن يكون qubit ، قبل قياسه ، في تراكب ، أي يساوي الصفر وواحد في نفس الوقت.

إذا تم استخدام العديد من وحدات البت ، فإن عدد الحالات المحتملة ينمو بشكل كبير: بالنسبة إلى عدد وحدات البت التي توجد في حالة تراكب ، يكون عدد الحالات أربعة:

|ψ rangle=k1|00 rangle+k2|01 rangle+k3|10 rangle+k4|11 rangle



ولثلاث وحدات ، هناك بالفعل ثماني ولايات:

|ψ rangle=k1|000 rangle+k2|001 rangle+k3|010 rangle+k4|011 rangle+k5|100 rangle+k6|100 rangle+k6|101 rangle+k7|110 rangle+k8|111 rangle



لا يمكن قياس هذه الحالات مباشرة ، لكن يمكن السيطرة عليها. في هذه الحالة ، تكون الدارة الكمومية ذات احتمال مختلف في عدة حالات في نفس الوقت ، والتي يمكن استخدامها للحوسبة المتوازية.

تسمى العوامل ذات القيم qubit بالسعة - هذه أرقام معقدة. إذا قمنا بحساب معامل السعة ومربعها ، فسوف نحصل على احتمال الحالة. مجموع الاحتمالات لجميع مجموعات الحالات qubit ، كما هو متوقع ، يجب أن يكون في نهاية المطاف مساويا للوحدة.

صورة

كأمثلة على حالات مختلفة من qubit ، يمكن للمرء إعطاء تدور الإلكترون أو استقطاب الفوتون ، ولكن هناك خيارات أخرى ممكنة أيضا. الشيء الرئيسي هو أنه يمكن أيضا ملاحظة التأثيرات الكمومية فيها. وهكذا ، يمكن أن يكون أي جسيم تقريبًا: إلكترون ، فوتون ، أيون ، وما إلى ذلك.

كيف يمكن أن يكون الجسيم في حالتين في وقت واحد ولماذا يتم فقدان المعلومات حول إحدى الحالات تمامًا عند قياس البادئة؟ الأكثر شيوعا هما تفسيران:

يدعي تفسير كوبنهاغن أن تفسير موضع الجسيم قبل القياس لا معنى له ، لأن الفيزياء هي علم قائم على قياسات دقيقة ، ويجب ألا تفسر تلك الظواهر التي لا يمكن ملاحظتها. وبالتالي ، إذا قبلنا تفسير كوبنهاغن ، يمكننا أن نستنتج أنه لا يوجد واقع موضوعي على المستوى المادي الجزئي.

يلتزم بعض العلماء بتفسير متعدد العالم ، حيث يوجد عدد لا حصر له من الأكوان المتوازية ، وفي بعض أجزاء هذه الأكوان يمكن للجسيم أن يأخذ الحالة الصفرية ، وفي البقية يمكنه أن يأخذ حالة واحدة. يمكن العثور على الوصف الأكثر تفصيلا والتبرير الفلسفي للتفسير متعدد العالم في كتاب David Deutsch ، The Structure of Reality.

في أي حال ، وبغض النظر عن أي من هذه التفسيرات التي تفضلها ، يمكننا أن نفترض أنه عند قياس الكويبيت ، تنهار وظيفة الموجة (أي أنها تتوقف عن التصرف مثل الموجة وتظهر خواص الجسيمات) ، في حين أن الكوبيت يأخذ إحدى الحالات ، هناك في الواقع أصبح قليلا الكلاسيكية.

بشكل عام ، تعد البتات الكلاسيكية مجموعة فرعية من البتات ، لذلك يمكن اعتبار علوم الكمبيوتر الكلاسيكية مجموعة فرعية من علم الحوسبة الكمومية. كما ذكرنا أعلاه ، فإن أي جزء من البتات بعد القياس يصبح بتًا كلاسيكيًا ، ومع ذلك ، يمكن نقله لاحقًا إلى حالة تراكب.

من أجل الاستمرار في الحصول على بعض المعلومات على الأقل حول تراكب qubit ، يمكنك استخدام اختراق حياة بسيط إلى حد ما: قم بإنشاء تراكب واحد عدة مرات (قم بالتصرف على qubit مع نفس المشغلين) وقياس qubit في كل مرة. من توزيع الأصفار وتلك التي تم الحصول عليها أثناء القياسات ، يمكن للمرء الحصول على فكرة عن الاحتمالات ، أي معرفة ما يمكن أن تساويه وحدات السعات لحالات الكابت.

ما هي فوائد التعلم الكم آلة


ما هي مزايا تراكب الحوسبة؟ إذا كان على جهاز كمبيوتر عادي ، عند تشغيل برامج متعددة الخيوط ، مطلوب معالج منطقي واحد لكل مؤشر ترابط ، ثم في جهاز كمبيوتر كمي يمكن أن يزداد عدد مؤشرات الترابط بشكل كبير مع زيادة عدد البتات في الدائرة.

على سبيل المثال ، إذا كانت 1024 تدفقات في كمبيوتر عادي تتطلب نفس العدد من المعالجات المنطقية ، فعندئذٍ في المعامل الكمومي هي 10 فقط. صحيح ، لا يمكن استخدام هذه التدفقات بشكل غير مباشر ، أي ، لا يمكن مراقبتها مباشرة.

يجب أن تفهم أيضًا أن الخوارزميات التي يستخدمها الكمبيوتر الكمومي تختلف عن الخوارزميات التي تمت دراستها في أقسام علوم الكمبيوتر على أجهزة الكمبيوتر الكلاسيكية. بالطبع ، لا يمكنك نقل الخوارزمية الكلاسيكية إلى كمبيوتر الكم دون تغييرها أولاً. علاوة على ذلك ، من غير المرجح أن يبقى شيء مهم من الخوارزمية الأصلية. على الأرجح ، سيتم تغييره تمامًا ، بحيث تبقى منه فكرة عامة فقط (إذا بقي شيء ما على الإطلاق).

يمكن قول الشيء نفسه عن التعلم الآلي. بالنسبة لأجهزة الكمبيوتر الكمومية ، توجد بالفعل نظائر خوارزميات تعلم الآلة الكلاسيكية (على سبيل المثال ، Random Forest و KNN والشبكات العصبية). ولكن ، أولاً ، يتم تنفيذها بطريقة مختلفة ، وثانياً ، عاجلاً أم آجلاً ، ستظهر خوارزميات جديدة تمامًا ستستفيد بشكل كامل من مزايا الحوسبة الكمومية.

يدرك جميع المتخصصين في مجال البيانات الضخمة والذكاء الاصطناعي المواقف التي يتعين على العالم فيها الانتظار لفترة طويلة حتى يتعلم النموذج.

بالطبع ، هناك نماذج بسيطة (مثل الانحدار الخطي) تتدرب على البيانات الصغيرة خلال ثوانٍ ، ولكن في حالة النماذج الأكثر تعقيدًا ، مثل الشبكات العصبية ، يمكن أن يستمر التدريب من بضع دقائق إلى عدة أسابيع. من أجل فرز العديد من المتغيرات من هذه النماذج ، مطلوب صبر ملحوظ.

هناك أيضًا نماذج من هذا القبيل حتى تاريخ المريض الأكثر صراحةً سيرفض استخدامها. على وجه الخصوص ، النماذج التي تحتوي على عدد كبير من الأوزان أو تلك التي تتطلب بحثًا شاملاً عن عدد متزايد بشكل هائل من المجموعات. استخدام أجهزة الكمبيوتر الكمومية مناسب لمثل هذه المهام ، والتي يمكن أن تقلل من وقت الحساب من عدة سنوات إلى عدة دقائق.

لماذا يحتاج الذكاء الاصطناعي إلى تسريع الخوارزميات


في العامين أو الثلاثة أعوام الماضية ، كان هناك تطور سريع لتقنيات رؤية الكمبيوتر ، وخلال العام الماضي تم اختراع الكثير في معالجة اللغة الطبيعية.

في هذه الحالة ، يستمر تدريب النماذج المعقدة لفترة طويلة جدًا. ولكن إذا افترضنا أن النماذج ذات التعقيد نفسه أو حتى التعقيد الأكبر ستستغرق وقتاً أقل من الحجم ، فسيكون من الممكن اختبار الفرضيات واختبار النماذج بشكل أسرع.

وفقًا لذلك ، يمكن أن يحدث تقدم في هذه المجالات بوتيرة متسارعة: بدلاً من اكتشاف واحد أو اثنين من الاكتشافات البارزة كل شهر ، يمكننا أن نسمع عن هذا اليوم يمكن للنمو المضاعف في تقدم الحوسبة الكمومية أن يؤدي إلى نفس معدل التقدم في التعلم الآلي.

آليات الحوسبة الكمومية


يمكن أن يعمل الفوتون أو الإلكترون أو الأيونات أو بعض الجسيمات الأخرى كجسيم. إذا كان هذا إلكترونًا ، فيمكن للمرء قياس دورانه (الزخم الزاوي المناسب) وبالتالي الحصول على 0 أو 1. في تدوين Dirac ، يتم الإشارة إلى هذه الحالات على النحو التالي:

|0 rangle،|1 rangle

،



يمكن أيضًا التعبير عن حالة qubit باستخدام ناقل. هذا هو متجه الحالة لـ qubit يساوي 0:

|0 rangle= تبدأbmatrix10 endbmatrix

تبدأ



وهذا ناقل qubit يساوي 1:

|1 rangle= startbmatrix01 endbmatrix



يلعب مشغل Hadamard دورًا مهمًا في الحوسبة الكمومية:

H_1 = \ frac {1} {\ sqrt {2}} \ تبدأ {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix}



طريقة واحدة للحصول على تراكب هي تطبيق عامل التشغيل Hadamard على qubit في إحدى الولايات الأساسية اثنين. في هذه الحالة ، نحصل على حالة qubit عندما تكون احتمالات الحصول على 0 أو 1 بعد القياس متساوية. هذه هي الطريقة التي سيتم بها الحصول على التراكب إذا كانت الحالة الأولية لقيمة qubit صفر:

\\ H_1 \ cdot | 0 \ rangle = \ frac {1} {\ sqrt {2}} \ تبدأ {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix} \ \ cdot \ start {bmatrix} 1 \\ 0 \ end { bmatrix} = \ frac {1} {\ sqrt {2}} (| 0 \ \ rangle + | 1 \ rangle)



لكن مثل هذا التراكب سينتهي إذا كانت الحالة الأولية واحدة:

\\ H_1 \ cdot | 1 \ rangle = \ frac {1} {\ sqrt {2}} \ تبدأ {bmatrix} 1 & 1 \\ 1 & -1 \ end {bmatrix} \ \ cdot \ start {bmatrix} 0 \\ 1 \ end { bmatrix} = \ frac {1} {\ sqrt {2}} (| 0 \ \ rangle - | 1 \ rangle)



هناك خيار شائع آخر للتعامل مع الكيومتيتات وهو استخدام التشابك الكمومي - مثل هذا الترابط بين اثنين من الببتات ، عندما يظهران ارتباطًا بنسبة 100٪ حتى عندما يتم الفصل بينهما على مسافة كبيرة. في علاقة مباشرة ، إذا كان أحد البتات بعد القياس يفترض حالة معينة ، فإن البايت الآخر يكتسب نفس الحالة تمامًا. مع وجود علاقة عكسية ، تأخذ الكيبيتات حالات معاكسة بعد القياس.

ما هي إمكانيات الحوسبة الكمومية والتعلم الآلي الكم؟


يمكن لجميع المتخصصين الذين يرغبون في توفير الوقت استخدام الحوسبة الكمومية للتعلم الآلي. تحدث عمليات مثل تحويل فورييه السريع والعثور على المصفوفة العكسية وحساب القيم الذاتية ومتجهات المصفوفة على جهاز كمبيوتر الكم مع تسارع الأسي.

بالطبع ، يمكن مواصلة العمل الذي لا يتطلب الكثير من الموارد (على سبيل المثال ، تصور البيانات) على جهاز كمبيوتر عادي ، ولكن يمكن إعطاء خوارزميات التعلم الآلي ، أو على الأقل الأجزاء التي يمكن تسريعها باستخدام وحدات البت ، إلى كمبيوتر كمّي.

أحد الأسئلة التي تزعج المتخصصين: كيفية التعامل مع البيانات في الحوسبة الكمومية؟ تخيل الموقف الذي لدينا فيه صورة (لجعلها أسهل ، فليكن أبيض وأسود) ، والتي نريد إرسالها إلى مدخلات الشبكة العصبية الكمية. يبلغ حجم الصورة 256 × 256 بكسل - وهو حجم قياسي للتعرف على الصورة.

لتمثيل هذه الصورة كأرقام ، نقوم بتشفير كل بكسل برقم الفاصلة العائمة 64 بت (في الواقع ، عدد صحيح من 8 بت سيكون كافيًا ، ولكن في الممارسة العملية ، يتم تغيير المصفوفة التي تحتوي على قيم البيكسل قبل تطبيقها على إدخال الشبكة العصبية ، لذلك يتم تعبئة المصفوفة بأرقام 32 أو 64 بت). يمكن تمثيل هذه الصورة في شكل مصفوفة تتكون من 65536 رقمًا ، والتي سوف تزن 512 كيلو بايت (تتلقى الشبكة العصبية صورة غير مضغوطة كمدخل) ، أي ستكون هناك حاجة إلى 4194304 بت.

إذا تم تشفير هذه الصورة باستخدام وحدات البت ، فسيكون عددها أقل من ذلك بكثير: سوف نترجم عدد وحدات البحث في عدد التوابع ، ويمكن تمثيل قيمة كل بكسل على أنها السعة لكل حالة ممكنة. عدد هذه الحالات اثنين في درجة ن. للعثور على n ، نجد اللوغاريتم الثنائي لعدد البكسل.

كما ترون ، فإن الإجراءات بسيطة للغاية ، لذلك ليس عليك حتى كتابة الصيغ. كنتيجة لذلك ، يتضح أن الرقم n هو 16. وهذا هو عدد البتات المطلوبة لترميز هذه الصورة ، أي أقل بمقدار 262144 مرة من استخدام البتات الكلاسيكية.

إذا كان لدينا 66 بت ، ثم ترجمتها إلى تراكب ، يمكنك تشفير أكثر من تريليون صورة ملونة بتنسيق 4K.

وهكذا ، فإن التشفير الكمي يسمح للمرء بتحقيق ضغط لوغاريتمي للمعلومات. وفقًا لذلك ، يمكن أن يكون تسريع أساليب التعلم الآلي عند التعامل مع هذه البيانات أسيًا.

لغات البرمجة والمكتبات المتخصصة


اليوم ، العديد من لغات البرمجة لديها مكتبات للحوسبة الكمومية. تعمل بعض هذه المكتبات فقط مع محاكاة الحوسبة الكمومية ، ولكن العديد منها يدعم أجهزة الكمبيوتر الكمومية الحقيقية ، بما في ذلك الحوسبة السحابية ، كواجهة خلفية.

إذا كنت تعمل مباشرة مع الكيبيتس ، فهذا أقرب إلى كتابة كود المجمع ذي المستوى المنخفض على أجهزة الكمبيوتر الكلاسيكية. ومن الغريب أن بايثون هي إحدى لغات البرمجة "المنخفضة المستوى" هذه المستخدمة في برمجة الحسابات على أجهزة الكمبيوتر الكمومية.

تعمل إحدى المكتبات الخاصة بهذه اللغة - Qiskit - على جهاز المحاكاة وعلى الواجهة الخلفية الكمومية ، كما تتيح إجراء عمليات على وحدات البت في مستوى منخفض. من أجل البرمجة عالية المستوى ، من المريح استخدام PennyLane ، مكتبة للتعلم الآلي الكم. يحتوي مستودع هذه المكتبة على أمثلة عن تنفيذ خوارزميات التعلم الآلي ، بما في ذلك الشبكة العصبية الكمية.

آفاق الحوسبة الكمومية


في يناير 2019 ، تم إصدار أول كمبيوتر كمومي تجاري - IBM Q System One. الآن أيضًا ، بالنسبة للحوسبة الكمومية ، يمكنك استخدام الأنظمة السحابية لكل من الباحثين والشركات التجارية.

يمكن للجميع تشغيل خوارزمية الكم الخاصة بهم على النظام الأساسي السحابي لـ IBM Q Experience ، ولإنشاء مخطط كم ، ليس من الضروري حتى معرفة لغات البرمجة ، لأنه بالإضافة إلى إدخال الأوامر ، يمكنك استخدام الواجهة الرسومية المسماة Circuit Composer.

في سبتمبر 2019 ، ظهرت معلومات غير رسمية تفيد بأن Google قد حققت التفوق الكمي من خلال حل واحدة من المشاكل على جهاز كمبيوتر الكم بسرعة غير متوفرة حتى لأقوى أجهزة الكمبيوتر العملاقة. حتى لو كانت الأخبار سابقة لأوانها ، فإن مثل هذه التقارير تشير إلى أن التفوق الكمي يقترب.

يبحث العديد من عمالقة تكنولوجيا المعلومات على الفور عن أفضل الحلول لأجهزة الكمبيوتر الكمومية. يتوقع بعض الباحثين تطبيق قانون مشابه لقانون مور على أجهزة الكمبيوتر الكمومية.

صحيح أن سرعة التطوير ، على عكس أجهزة الكمبيوتر التقليدية ، من المرجح ألا تكون أحد الأسس العادية ، ولكن مضاعفة ، لذلك سيتعين على المبرمجين الذين يعملون مع الحوسبة الكمومية إنشاء عدد كبير من البرامج في المستقبل القريب.

بالنسبة إلى مجال الإعلان والتسويق ، الذي أعمل فيه حاليًا ، يجب أن تخضع نماذج تعلم الآلة المطبقة إلى تحول كامل. ما يعمل على أجهزة الكمبيوتر الكلاسيكية سيكون أدنى بكثير من حيث السرعة والجودة لنماذج المستقبل.

ستحدث أحدث التقنيات تغييرات أقل في عملية المسح الضوئي للجماهير المستهدفة. السير المحيرة التي تحركها الحواسيب الكمومية ستحرك مساحات مفتوحة من الشبكات الاجتماعية ، وتلتقط أصغر التغييرات في أذواق الجمهور ومزاجه. من يدري ، ربما لا يمكن إطلاق الحملات الإعلانية نفسها إلا عن طريق الإعراب عن التمنيات العامة للكمبيوتر بشأن أهدافها.

Source: https://habr.com/ru/post/ar472760/


All Articles