
مرحبا القراء!
لقد قمت مؤخرًا بإطلاق مستودع تعلم الآلة المنزلية ، والذي يحتوي على أمثلة من خوارزميات ونُهج تعلم الآلة الشائعة ، مثل الانحدار الخطي ، والانحدار اللوجستي ، وطريقة الوسائل K والشبكة العصبية (الإدراك المتعدد الطبقات). تحتوي كل خوارزمية على صفحات تجريبية تفاعلية تم إطلاقها في Jupyter NBViewer-e أو Binder-e. وبالتالي ، يتمتع كل فرد بفرصة تغيير بيانات التدريب ومعلمات التدريب والاطلاع على الفور على نتائج التدريب والتصور والتنبؤ بالنموذج في متصفحهم دون تثبيت Jupyter محليًا.
الغرض من هذا المستودع هو تنفيذ الخوارزميات تقريبا من الصفر ، من أجل الحصول على فهم أكثر تفصيلا للنماذج الرياضية التي تكمن وراء كل من الخوارزميات. كانت المكتبات الرئيسية المستخدمة هي NumPy و Pandas . تستخدم هذه المكتبات لعمليات فعالة على المصفوفات ، وكذلك لتحميل وتفاصيل بيانات ملف CSV. في الصفحات التجريبية لتخطيط الرسوم البيانية وتصور بيانات التدريب ، يتم استخدام مكتبات Matplotlib و Plotly أيضًا. في حالة الانحدار اللوجستي ، يتم استخدام مكتبة SciPy لتقليل وظيفة الفقد ، ولكن في حالات أخرى ، يتم تطبيق النسب التدرج في NumPy / Python النقي. يتم تجنب استخدام المكتبات مثل PyTorch أو TensorFlow بسبب غرض التدريس في المستودع.
في الوقت الحالي ، يتم تنفيذ الخوارزميات التالية في المستودع ...
الانحدار. الانحدار الخطي.
في المشكلات المرتبطة بالانحدار ، نحاول التنبؤ بالعدد الحقيقي استنادًا إلى البيانات الواردة. في الواقع ، نحن نبني مستوى خط / طائرة / ن الأبعاد على طول بيانات التدريب من أجل أن نكون قادرين على التنبؤ ببيانات الإدخال غير الموجودة في مجموعة التدريب. يحدث هذا ، على سبيل المثال ، إذا كنا نريد التنبؤ بتكلفة الشقة المكونة من غرفتين ، في وسط N ، في الطابق السابع.
التصنيف. الانحدار اللوجستي.
في المشكلات المتعلقة بالتصنيف ، نقوم بتقسيم البيانات إلى فئات وفقًا لمعلمات هذه البيانات. مثال على مهمة تصنيف هو التعرف على البريد العشوائي. اعتمادًا على نص الرسالة (البيانات الواردة) نقوم بتخصيص كل حرف إلى أحد فئتين ("البريد العشوائي" أو "غير المرغوب فيه").
التجميع طريقة K- يعني.
في مهام التجميع ، نقوم بتقسيم بياناتنا إلى مجموعات غير معروفة لنا مقدمًا. يمكن استخدام هذه الخوارزميات لتجزئة السوق وتحليل الشبكات الاجتماعية وليس الشبكات فقط.
الشبكات العصبية. متعدد الطبقات Perceptron (MLP).
من الأرجح ألا تكون الشبكات العصبية خوارزمية ، بل هي "نمط" أو "إطار" لتنظيم خوارزميات مختلفة للتعلم الآلي في نظام واحد لمزيد من التحليل لبيانات الإدخال المعقدة.
البحث عن الحالات الشاذة باستخدام التوزيع غاوسي
في المشكلات المرتبطة بالبحث عن الحالات الشاذة ، نحاول عزل مثيلات البيانات التي تبدو "مشبوهة" مقارنة بمعظم الحالات الأخرى. على سبيل المثال ، تعريف المعاملات غير التقليدية (المشبوهة) عن طريق بطاقة الائتمان.
آمل أن تجد المستودع مفيدًا ، إما عن طريق تجربة العروض التوضيحية لكل خوارزمية ، أو عن طريق قراءة النماذج الرياضية التي تقف وراءها ، أو عن طريق تحليل تفاصيل التنفيذ لكل منها.
الترميز الناجح!