1.1 مقدمة
بفضل التعلم الآلي ، لا يُطلب من المبرمج كتابة التعليمات التي تأخذ في الاعتبار جميع المشاكل المحتملة وتحتوي على جميع الحلول. بدلاً من ذلك ، يتم وضع جهاز كمبيوتر (أو برنامج منفصل) مع خوارزمية لإيجاد حلول بشكل مستقل من خلال الاستخدام المتكامل للبيانات الإحصائية التي يتم اشتقاق الأنماط منها بناءً على التنبؤات التي يتم إجراؤها.
يرجع تاريخ تقنية التعلم الآلي استنادًا إلى تحليل البيانات إلى عام 1950 ، عندما بدأوا في تطوير البرامج الأولى للعب لعبة الداما. على مدار العقود الماضية ، لم يتغير المبدأ العام. ولكن بفضل النمو الهائل في قوة الحوسبة لأجهزة الكمبيوتر ، أصبحت القوانين والتوقعات التي أنشأتها أكثر تعقيدًا ، واتسع نطاق المشكلات والمشكلات التي تم حلها باستخدام التعلم الآلي.
لبدء عملية التعلم الآلي ، يلزم أولاً تنزيل مجموعة البيانات (كمية معينة من بيانات الإدخال) إلى الكمبيوتر ، حيث ستتعلم الخوارزمية معالجة الطلبات. على سبيل المثال ، قد تكون هناك صور للكلاب والقطط التي لديها بالفعل علامات تشير إلى من ينتمون إليها. بعد عملية التدريب ، سيتمكن البرنامج نفسه من التعرف على الكلاب والقطط في صور جديدة دون محتوى علامة. تستمر عملية التعلم حتى بعد إصدار التوقعات ، فكلما قمنا بتحليل البيانات من قبل البرنامج ، زادت دقة التعرف على الصور المطلوبة.
بفضل التعلم الآلي ، تتعلم أجهزة الكمبيوتر التعرف على الصور والرسومات ليس فقط على الوجوه ، ولكن أيضًا على المناظر الطبيعية والأشياء والنصوص والأرقام. بالنسبة للنص ، هنا لا يمكن الاستغناء عن التعلم الآلي: وظيفة التحقق من القواعد موجودة الآن في أي محرر نصوص وحتى في الهواتف. علاوة على ذلك ، لا يتم أخذ تهجئة الكلمات في الحسبان فحسب ، بل أيضًا السياق وظلال المعنى والجوانب اللغوية الأخرى الدقيقة. علاوة على ذلك ، يوجد بالفعل برنامج قادر على كتابة المقالات الإخبارية (حول الاقتصاد ، على سبيل المثال ، الرياضة) دون تدخل بشري.
1.2 أنواع مهام التعلم الآلي
جميع المهام التي تم حلها باستخدام ML تندرج في واحدة من الفئات التالية.
1) مهمة الانحدار عبارة عن توقعات تستند إلى عينة من الكائنات ذات السمات المختلفة. يجب أن يكون الناتج رقمًا حقيقيًا (2 ، 35 ، 76.454 ، إلخ) ، على سبيل المثال ، سعر الشقة ، وقيمة الضمان بعد ستة أشهر ، والدخل المتوقع للمخزن للشهر التالي ، ونوعية النبيذ أثناء الاختبار العمياء.
2) مهمة التصنيف هي الحصول على إجابة قاطعة تستند إلى مجموعة من الميزات. يحتوي على عدد محدد من الإجابات (عادةً بتنسيق "نعم" أو "لا"): هل هناك قطة في الصورة ، هل الصورة وجه إنساني ، هو مريض بالسرطان.
3) مهمة التجميع هي توزيع البيانات في مجموعات: تقسيم جميع عملاء مشغل الهاتف المحمول على مستوى الملاءة ، وتعيين الأجسام الفضائية لفئة أو أخرى (الكوكب ، النجوم ، الثقب الأسود ، إلخ).
4) تتمثل مهمة تقليل البعد في تقليل عدد كبير من الميزات إلى أصغر (عادةً 2-3) لتوفير الراحة في التصور اللاحق (على سبيل المثال ، ضغط البيانات).
5) مهمة الكشف عن الحالات الشاذة هي فصل الحالات الشاذة عن الحالات القياسية. للوهلة الأولى ، يتزامن مع مهمة التصنيف ، ولكن هناك فرقًا كبيرًا: الشذوذ ظاهرة نادرة ، وأمثلة التدريب التي يمكنك من خلالها تدريب نموذج التعلم الآلي لتحديد مثل هذه الأشياء إما صغيرة الحجم أو ببساطة لا تعمل ، لذلك لا تعمل طرق التصنيف هنا . في الممارسة العملية ، تتمثل هذه المهمة ، على سبيل المثال ، في تحديد الأنشطة الاحتيالية باستخدام البطاقات المصرفية.
1.3 الأنواع الأساسية للتعلم الآلي
يتعلق الجزء الأكبر من المهام التي تم حلها باستخدام أساليب التعلم الآلي بنوعين مختلفين: التعلم مع المعلم (التعلم الخاضع للإشراف) أو بدونه (التعلم غير الخاضع للإشراف). ومع ذلك ، فإن هذا المعلم ليس بالضرورة هو المبرمج نفسه ، الذي يقف فوق الكمبيوتر ويتحكم في كل إجراء في البرنامج. "المعلم" من حيث التعلم الآلي هو التدخل البشري نفسه في عملية معالجة المعلومات. في كلا النوعين من التدريب ، توفر الماكينة بيانات أولية سيكون عليها تحليل النماذج والبحث عنها. الفرق الوحيد هو أنه عند التعلم مع المعلم ، هناك عدد من الفرضيات التي تحتاج إلى دحض أو تأكيد. هذا الاختلاف سهل الفهم بالأمثلة.
آلة التعلم مع المعلملنفترض أن لدينا معلومات حول عشرة آلاف شقة في موسكو: المساحة أو الأرض أو الحي أو التواجد أو عدم وجود مواقف للسيارات في المنزل أو المسافة من المترو أو سعر الشقة أو ما إلى ذلك. نحتاج إلى إنشاء نموذج يتنبأ بالقيمة السوقية للشقة وفقًا لمعاييرها. هذا مثال مثالي للتعلم الآلي مع المعلم: لدينا البيانات الأولية (عدد الشقق وممتلكاتها ، والتي تسمى علامات) والإجابة الجاهزة لكل شقة هي كلفتها. البرنامج لديه لحل مشكلة الانحدار.
مثال آخر من الممارسة: لتأكيد أو إنكار وجود مرض السرطان في المريض ، مع العلم بجميع مؤشراته الطبية. معرفة ما إذا كانت الرسالة الواردة غير مرغوب فيها من خلال تحليل النص. هذه كلها مهام التصنيف.
تعلم الآلة بدون معلمفي حالة التدريب بدون معلم ، عندما لا يتم توفير "الإجابات الصحيحة" الجاهزة للنظام ، يصبح كل شيء أكثر إثارة للاهتمام. على سبيل المثال ، لدينا معلومات حول وزن وطول عدد معين من الأشخاص ، ويجب تقسيم هذه البيانات إلى ثلاث مجموعات ، سيتعين على كل مجموعة خياطة قمصان بأحجام مناسبة. هذه مهمة تجميع. في هذه الحالة ، من الضروري تقسيم جميع البيانات إلى 3 مجموعات (ولكن ، كقاعدة عامة ، لا يوجد مثل هذا التقسيم الصارم والوحيد الممكن).
إذا اتخذنا موقفًا مختلفًا ، عندما يكون لكل كائن في العينة المئات من الميزات المختلفة ، فإن الصعوبة الرئيسية ستكون العرض الرسومي لمثل هذه العينة. لذلك ، يتم تقليل عدد العلامات إلى اثنتين أو ثلاث ، ويصبح من الممكن تصورها على متن طائرة أو ثلاثية الأبعاد. هذه هي مهمة الحد من البعد.
1.4 الخوارزميات الأساسية لنماذج التعلم الآلي
1. شجرة القرارهذه طريقة لدعم القرار تعتمد على استخدام رسم بياني شجرة: نموذج قرار يأخذ في الاعتبار عواقبه المحتملة (مع الأخذ في الاعتبار احتمال وقوع حدث) ، والكفاءة ، واستهلاك الموارد.
بالنسبة إلى العمليات التجارية ، تتكون هذه الشجرة من الحد الأدنى لعدد الأسئلة التي تتطلب إجابة محددة - "نعم" أو "لا". باستمرار إعطاء الإجابات على كل هذه الأسئلة ، نأتي إلى الخيار الصحيح. تتمثل المزايا المنهجية لشجرة القرار في أنها تقوم بتكوين المشكلة وتنظيمها ، ويتم اتخاذ القرار النهائي على أساس الاستنتاجات المنطقية.
2. تصنيف بايزي السذاجةتنتمي المصنفات السذاجة بايز إلى عائلة من المصنفات الاحتمالية البسيطة وتنشأ من نظرية بايز ، والتي في هذه الحالة تعتبر الوظائف مستقلة (وهذا ما يسمى افتراض صارم أو ساذج). في الممارسة العملية ، يتم استخدامه في مجالات التعلم الآلي التالية:
- الكشف عن رسائل البريد الإلكتروني العشوائية
- الربط التلقائي للمقالات الإخبارية بالأقسام المواضيعية ؛
- تحديد التلوين العاطفي للنص ؛
- التعرف على الوجوه والأنماط الأخرى في الصور.
3. طريقة المربعات الصغرىأي شخص درس الإحصاءات على الأقل قليلاً على دراية بمفهوم الانحدار الخطي. ترتبط المربعات الصغرى أيضًا بخيارات التنفيذ الخاصة به. عادة ، يحل الانحدار الخطي مشكلة تركيب خط مستقيم يمر عبر العديد من النقاط. إليك كيفية القيام بذلك باستخدام طريقة المربعات الصغرى: ارسم خطًا مستقيمًا ، وقياس المسافة منه إلى كل نقطة (صل النقاط والخط بمقاطع رأسية) ، وانقل المبلغ الناتج لأعلى. كنتيجة لذلك ، يكون المنحنى الذي سيكون فيه مجموع المسافات هو الأصغر هو المنحنى المطلوب (سوف يمر هذا الخط بنقاط ذات انحراف موزع عادةً عن القيمة الحقيقية).
تُستخدم الوظيفة الخطية عادةً في اختيار البيانات للتعلم الآلي ، ويتم استخدام طريقة المربعات الصغرى لتقليل الأخطاء عن طريق إنشاء مقياس خطأ.
4. الانحدار اللوجستيالانحدار اللوجستي هو وسيلة لتحديد العلاقة بين المتغيرات ، أحدها يعتمد بشكل قاطع والآخرون مستقلون. لهذا الغرض ، يتم استخدام الوظيفة اللوجستية (التوزيع اللوجستي التراكمي). تكمن الأهمية العملية للانحدار اللوجستي في أنها طريقة إحصائية قوية للتنبؤ بالأحداث ، والتي تشتمل على واحد أو أكثر من المتغيرات المستقلة. هذا في الطلب في الحالات التالية:
- سجل الائتمان
- قياس نجاح الحملات الإعلانية المستمرة ؛
- توقعات الربح لمنتج معين ؛
- تقييم احتمال وقوع زلزال في تاريخ محدد.
5. دعم طريقة المتجهات (SVM)هذه مجموعة كاملة من الخوارزميات اللازمة لحل مشاكل التصنيف وتحليل الانحدار. استنادًا إلى حقيقة أن الكائن الموجود في الفضاء ذي الأبعاد N ينتمي إلى أحد فئتين ، فإن طريقة متجه الدعم تقوم بإنشاء طائرة تشعبية ذات بعد (N - 1) بحيث تظهر جميع الكائنات في إحدى المجموعتين. على الورق ، يمكن تمثيل ذلك على النحو التالي: هناك نقاط من نوعين مختلفين ، ويمكن تقسيمهما خطيًا. بالإضافة إلى نقاط الفصل ، تقوم هذه الطريقة بإنشاء لوحة تشعبية بطريقة تجعلها أقرب ما يمكن من أقرب نقطة في كل مجموعة.
تساعد SVM وتعديلاته على حل مهام التعلم المعقدة مثل ربط DNA ، وتحديد جنس الشخص من الصور ، وعرض لافتات إعلانية على مواقع الويب.
6. طريقة الفرقيعتمد على خوارزميات التعلم الآلي التي تولد العديد من المصنفات وتفصل جميع الكائنات عن البيانات المستلمة حديثًا بناءً على متوسط نتائج التصويت أو نتائجها. في البداية ، كانت طريقة الفرقة عبارة عن حالة خاصة لمتوسط بايزي ، ولكن بعد ذلك أصبحت أكثر تعقيدًا وتمت ملئها بخوارزميات إضافية:
- تعزيز - يحول النماذج الضعيفة إلى نماذج قوية من خلال تشكيل مجموعة من المصنفات (من وجهة نظر رياضية ، هذا تقاطع محسّن) ؛
- bagging (bagging) - يجمع المصنفات المتطورة ، بينما يقوم في نفس الوقت بتدريب الأساسيات (تحسين الارتباط) ؛
- تصحيح الخطأ من الناتج الترميز.
طريقة التجميع هي أداة أكثر قوة مقارنة بنماذج التنبؤ المستقلة ، للأسباب التالية:
- أنه يقلل من تأثير الحوادث من خلال حساب متوسط أخطاء كل مصنف أساسي ؛
- يقلل التشتت ، نظرًا لأن العديد من النماذج المختلفة المستندة إلى فرضيات مختلفة من المرجح أن تصل إلى النتيجة الصحيحة أكثر من تلك التي يتم أخذها بشكل منفصل ؛
- يستبعد تجاوز نطاق المجموعة: إذا كانت الفرضية المجمعة خارج مجموعة الفرضيات الأساسية ، ثم في مرحلة تشكيل الفرضية المدمجة يتم توسيعها باستخدام طريقة أو أخرى ، وقد تم بالفعل تضمين الفرضية فيها.
7. تجميع الخوارزمياتتتكون المجموعة في توزيع العديد من الكائنات إلى فئات بحيث توجد في كل فئة - الكتلة - العناصر الأكثر تشابهًا.
يمكنك تجميع الكائنات باستخدام خوارزميات مختلفة. الأكثر شيوعا هي:
- استنادا إلى مركز الثقل للمثلث ؛
- بناء على اتصال
- تخفيض الأبعاد ؛
- الكثافة (على أساس التجميع المكاني) ؛
- احتمالي.
- التعلم الآلي ، بما في ذلك الشبكات العصبية.
تُستخدم خوارزميات التجميع في علم الأحياء (دراسة تفاعل الجينات في جينوم مع ما يصل إلى عدة آلاف من العناصر) ، وعلم الاجتماع (معالجة نتائج الدراسات الاجتماعية باستخدام طريقة وارد ، وإعطاء مجموعات عن الحد الأدنى من التشتت وبنفس الحجم تقريبا) وتكنولوجيا المعلومات.
8. طريقة المكون الرئيسي (PCA)طريقة المكونات الرئيسية ، أو PCA ، هي عملية إحصائية حول التحول المتعامد ، والتي تهدف إلى ترجمة ملاحظات المتغيرات التي يمكن ربطها بطريقة أو بأخرى إلى مجموعة من المكونات الرئيسية - القيم التي لا ترتبط بشكل خطي.
المهام العملية التي يتم فيها تطبيق PCA هي التصور ومعظم الإجراءات لضغط وتبسيط وتقليل البيانات من أجل تسهيل عملية التعلم. ومع ذلك ، فإن طريقة المكون الرئيسي ليست مناسبة للحالات التي تكون فيها البيانات الأولية سيئة الترتيب (أي ، تتميز جميع مكونات الطريقة بالتشتت العالي). لذلك يتم تحديد قابليتها للتطبيق من خلال مدى دراسة موضوع الدراسة ووصفه.
9. التحلل المفردفي الجبر الخطي ، يتم تعريف التحلل المفرد ، أو SVD ، على أنه تحلل مصفوفة مستطيلة تتكون من أرقام معقدة أو حقيقية. لذلك ، يمكن أن تتحلل مصفوفة M للأبعاد [m * n] بطريقة تجعل M = UΣV ، حيث U و V مصفوفات وحدوية ، و Σ قطري.
واحدة من الحالات الخاصة من التحلل المفرد هي طريقة المكون الرئيسي. تم تطوير أول تقنيات رؤية الكمبيوتر على أساس SVD و PCA وعملت على النحو التالي: أولاً ، تم تمثيل الوجوه (أو الأنماط الأخرى التي تم العثور عليها) على أنها مجموع المكونات الأساسية ، ثم تم تقليل أبعادها ، وبعد ذلك تمت مقارنتها بصور من العينة. الخوارزميات الحديثة للتحلل المفرد في التعلم الآلي ، بالطبع ، أكثر تعقيدًا وتطوراً من سابقاتها ، لكن جوهرها تغير بشكل عام.
10. تحليل المكونات المستقلة (ICA)هذا هو أحد الأساليب الإحصائية التي تكشف عن العوامل الخفية التي تؤثر على المتغيرات العشوائية والإشارات وما إلى ذلك. يقوم ICA بإنشاء نموذج عام لقواعد البيانات متعددة العوامل. تحتوي المتغيرات في النموذج على بعض المتغيرات المخفية ، ولا توجد معلومات حول قواعد مزجها. هذه المتغيرات المخفية هي مكونات عينة مستقلة وتعتبر إشارات غير غوسية.
على عكس تحليل المكونات الرئيسية ، المرتبطة بهذه الطريقة ، يكون تحليل المكونات المستقلة أكثر فعالية ، خاصة في الحالات التي تكون فيها الأساليب التقليدية عاجزة. يكتشف الأسباب الخفية للظواهر ، ونتيجة لذلك ، وجد تطبيقًا واسعًا في مختلف المجالات ، من علم الفلك والطب إلى التعرف على الكلام والاختبار التلقائي وتحليل ديناميات المؤشرات المالية.
1.5 أمثلة واقعية
مثال 1. تشخيص الأمراضالمرضى في هذه الحالة هم كائنات ، والعلامات هي كل الأعراض ، والتاريخ ، ونتائج الاختبار ، وتدابير العلاج التي اتخذت بالفعل (في الواقع ، التاريخ الطبي بأكمله ، شكلية ومقسمة إلى معايير منفصلة). بعض العلامات - الجنس أو وجود أو عدم وجود صداع ، والسعال ، والطفح الجلدي ، وغيرها - تعتبر ثنائية. يعتبر تقييم شدة الحالة (شديد الشدة ، معتدلة ، وما إلى ذلك) علامةً ترتيبية ، وكثيرون آخرون كميون: حجم الدواء ، ومستوى الهيموغلوبين في الدم ، ومؤشرات ضغط الدم والنبض والعمر والوزن. بعد جمع معلومات حول حالة المريض ، والتي تحتوي على العديد من هذه العلامات ، يمكنك تنزيلها على جهاز كمبيوتر ، وباستخدام برنامج قادر على التعلم الآلي ، حل المشكلات التالية:
- إجراء التشخيص التفريقي (تحديد نوع المرض) ؛
- اختيار استراتيجية العلاج الأمثل.
- للتنبؤ تطور المرض ، ومدة ونتائجها ؛
- حساب خطر المضاعفات المحتملة ؛
- تحديد المتلازمات - مجموعات من الأعراض المرتبطة بمرض معين أو اضطراب معين.
لا يوجد طبيب قادر على معالجة مجموعة كاملة من المعلومات لكل مريض على الفور ، وتلخيص عدد كبير من السجلات الطبية الأخرى المماثلة وإعطاء نتيجة واضحة على الفور. لذلك ، أصبح التعلم الآلي أداة لا غنى عنها للأطباء.
مثال 2. البحث عن الرواسب المعدنيةفي دور الإشارات هنا ، تم الحصول على المعلومات باستخدام التنقيب الجيولوجي: وجود أي صخور في المنطقة (وستكون هذه علامة على النوع الثنائي) ، خواصها الفيزيائية والكيميائية (التي تتحلل إلى عدد من العلامات الكمية والنوعية).
بالنسبة لعينة التدريب ، يتم أخذ نوعين من السوابق: المناطق التي توجد فيها الرواسب المعدنية بدقة ، والمناطق ذات الخصائص المتشابهة حيث لم يتم العثور على هذه المعادن. لكن استخراج المعادن النادرة له خصائصه الخاصة: في كثير من الحالات ، يتجاوز عدد العلامات بشكل كبير عدد الأشياء ، وأساليب الإحصاءات التقليدية غير ملائمة لمثل هذه الحالات. لذلك ، في التعلم الآلي ، ينصب التركيز على اكتشاف الأنماط في مجموعة بيانات تم جمعها بالفعل. لهذا الغرض ، يتم تحديد مجموعات صغيرة وأكثر إفادة من الميزات التي هي الأكثر دلالة على الإجابة على سؤال البحث - هل هناك حفرية معينة في المنطقة المشار إليها أم لا. يمكن للمرء أن يماثل القياس مع الطب: يمكن أن تكشف الودائع أيضًا عن متلازماتها. تكمن قيمة استخدام التعلم الآلي في هذا المجال في حقيقة أن النتائج التي تم الحصول عليها ليست عملية فقط ، ولكن أيضًا ذات أهمية علمية جدية لعلماء الجيولوجيا والجيوفيزيائيين.
3., . , 1960–1970- , .
, , – , , . , , , . , . (, ), — (, ), ( , , , , , ) (, -, , ).
, , . , 2 – «» «», «».
, , , . , (, , ). – .
PS , Python.