مجموعة مختارة من الأمثلة العملية لمعالجة البيانات

مرحبا القارئ.

على خطى مشاركتي الأولى من مجموعة مختارة من مجموعات البيانات للتعلم الآلي - سأقوم باختيار مجموعات البيانات الحديثة نسبيًا مع أمثلة عملية على معالجة البيانات. بعد كل شيء ، ليس سراً على أي شخص أن التعلم بأمثلة جيدة أكثر فعالية وأسرع. دعونا نرى ما هو مثير للاهتمام بالنسبة لنا سيكون قادرا على عرض بعض من أفضل الأمثلة على معالجة البيانات.

سيتم توريث مخطط العمل مع المنشور الحالي من مشاركتي حول أفضل دفاتر ملاحظات على ML و DS ، وهي - المحفوظة في الإشارات المرجعية - التي تم نقلها إلى زميل.

+ مكافأة في نهاية المقال - دورة رائعة من FPMI MIPT.

صورة

لذلك دعونا نبدأ.

مجموعة مختارة من مجموعات البيانات مع أمثلة عملية على معالجة البيانات:


معدلات الانتحار نظرة عامة 1985 حتي 2016 - مقارنة المعلومات الاجتماعية والاقتصادية مع معدلات الانتحار حسب السنة والبلد.

أمثلة المعالجة:


تصنيف الأغاني العالمي من Spotify هو تصنيف يومي لأكثر 200 أغنية تم الاستماع إليها في 53 دولة من عام 2017 وعام 2018 من قِبل مستخدمي Spotify.

مثال المعالجة:


الجرائم في بوسطن - سجلات من نظام الإبلاغ عن حوادث الجريمة في بوسطن ، والذي يتضمن الحوادث والمعلومات حول متى وأين حدث ذلك.

مثال المعالجة:


تطبيقات Google Play Store - الفئات والتصنيفات وحجم جميع تطبيقات Google Play.

مثال المعالجة:


بوكيمون لتعدين البيانات والتعلم الآلي - إحصائيات وميزات بوكيمون ؛

مثال المعالجة:


عناوين الأخبار مليون - بيانات من عناوين الأخبار المنشورة على مدى السنوات ال 15 الماضية.

مثال المعالجة:


تحطم طائرة منذ عام 1908 - تاريخ كامل من حوادث الطيران في جميع أنحاء العالم ، من 1908 إلى الوقت الحاضر.

مثال المعالجة:


مجموعة عناوين الأخبار الرئيسية للكشف عن السخرية هي مجموعة بيانات عالية الجودة لاكتشاف السخرية.

مثال المعالجة:


جودة الهواء التاريخية - يتم جمع بيانات جودة الهواء على الشاشات الخارجية في جميع أنحاء الولايات المتحدة.

مثال المعالجة:


حقائق التغذية لماكدونالدز القائمة - حقائق التغذية لكل عنصر القائمة في ماكدونالدز الولايات المتحدة الأمريكية.

مثال المعالجة:


LEGO Database - تفاصيل / مجموعات / الألوان والأسهم من كل LEGO الرسمي في قاعدة بيانات Rebrickable.

مثال المعالجة:


إحصاءات التجارة السلعية العالمية - استيراد وتصدير كميات لـ 5000 منتج في معظم دول العالم على مدار الثلاثين عامًا الماضية.

مثال المعالجة:


الجريمة في الهند - معلومات كاملة عن مختلف جوانب الجرائم المرتكبة في الهند منذ عام 2001.

مثال المعالجة:


التنبؤ بنجم النجم النابض - البيانات التي تم جمعها خلال دراسة استقصائية للكون.

أمثلة المعالجة:


العمالة الفرنسية ، المرتبات ، عدد السكان في المدينة - بيانات تظهر المساواة وعدم المساواة في فرنسا.

مثال المعالجة:


تعداد الولايات المتحدة - تعداد الولايات المتحدة.

مثال المعالجة:


أسعار المساكن في كاليفورنيا - سعر السكن في كاليفورنيا.

مثال المعالجة:


معدل البطالة الأمريكي حسب المقاطعة ، 1990-2016 - بيانات بطالة وزارة العمل الأمريكية.

مثال المعالجة:


محفوظات World of Warcraft Avatar History - مجموعة من السجلات التي تعرض معلومات تفصيلية عن شخصيات اللاعب في اللعبة بمرور الوقت.

مثال المعالجة:


بيانات اكتشاف موجات الجاذبية - بيانات عن أحداث موجات الجاذبية GW150914.

مثال المعالجة:


مكافأة!


وستكون المكافأة اليوم عبارة عن دورة رائعة للتعلم العميق لطلاب المدارس الثانوية المهتمين بالبرمجة والرياضيات ، وكذلك الطلاب الذين يرغبون في بدء التعلم العميق.

الغرض من هذه الدورة هو تقديم المبادئ الأساسية للتعلم العميق (الشبكات العصبية) في شكل تفاعلي وعلى سبيل المثال من المهام العملية.

برنامج الدورة


  1. Python: basics، Google Colab؛
  2. مقدمة في الجبر الخطي. ناقلات. المصفوفات والعمليات معهم. مكتبة NumPy
  3. الباندا والمكتبات MatPlotlib. أساسيات التعلم الآلي ؛
  4. عناصر نظرية التحسين. التدرج. نزول التدرج. نماذج خطية
  5. مقدمة في التعلم العميق. المستقبلات. الخلايا العصبية مع السيني (وظائف التنشيط الأخرى). أساسيات OOP في بيثون.
  6. مكتبة بيت تورش. شبكات عصبية متعددة الطبقات
  7. تدريب الشبكات العصبية في الممارسة. Cifar10 ، notMNIST ؛
  8. الشبكات العصبية التلافيفية. طبقة تلافيفية. طبقة التجميع
  9. ممارسة تدريب الشبكات العصبية. تصنيف علامات الطرق ؛
  10. نقل التعلم. شعبية في العمارة رؤية الكمبيوتر.
  11. تجزئة الصورة. U-نت.
  12. المنافسة في Kaggle ؛
  13. كشف الكائن YOLOv3.
  14. كلاسيك جان. نقل النمط العصبي.
  15. طرق معالجة النصوص الأساسية ؛
  16. كلمة حفلات الزفاف.
  17. الشبكات العصبية المتكررة.
  18. LSTM ، خلايا GRU.
  19. نماذج اللغة
  20. الترجمة الآلية
  21. Text2Speech.
  22. SuperResolution.

يمكنك أيضًا إلقاء نظرة على قناة Youtube التابعة لمدرسة التعليم العميق. هناك الكثير من مقاطع الفيديو الرائعة ؛)

بهذا ، انتهى اختيارنا القصير لأمثلة معالجة البيانات. أتمنى أن تكون قد تعلمت شيئًا جديدًا لنفسك. كما هو معتاد على حبري ، أعجبتني المشاركة - ضع علامة زائد. لا تنسى مشاركتها مع الزملاء. أيضًا ، إذا كان لديك شيء يمكنك مشاركته بنفسك - فاكتب في التعليقات. مزيد من المعلومات حول التعلم الآلي وعلوم البيانات على Habré وفي قناة البرق Neuron (neurondata).

كل المعرفة!

Source: https://habr.com/ru/post/ar460557/


All Articles