
(
ج )
إن Github ليس مجرد منصة للاستضافة والتطوير المشترك لمشاريع تكنولوجيا المعلومات ، ولكنه أيضًا قاعدة معارف ضخمة جمعها مئات الخبراء. لحسن الحظ ، لا توفر الخدمة أدوات للعمل فقط مع شفرة مفتوحة المصدر ، ولكن أيضًا مواد عالية الجودة للتدريب. اخترنا بعض المستودعات الشائعة وفرزناها حسب عدد النجوم بالترتيب التنازلي.
ستساعدك هذه المجموعة في معرفة المستودعات التي يجب أن تنتبه إليها إذا كنت مهتمًا بالعمل مع البيانات والتدريب المتعمق.
علم البيانات
الماجستير المفتوح المصدر لعلوم البياناتالنجوم: 11227 ، فوركس: 4،737
المستودع الرسمي لمنهج
الماجستير في علوم البيانات ، تم تطويره كبديل مفتوح المصدر للتعليم الرسمي في مجال علوم البيانات. المستودع عبارة عن مجموعة من المواد التدريبية التي تم جمعها على مدار عدة سنوات.
علم البيانات رهيبةالنجوم: 9،240 ، فوركس: 2،761
مجموعة قوية تجيب على الأسئلة: "ما هي علوم البيانات؟" و "ما تحتاج إلى معرفته حتى تكون على دراية جيدة بهذا العلم؟". تنقسم بسهولة إلى فئات. على سبيل المثال ، هناك
قائمة بالكتب حول علوم البيانات ، ومجموعة
مختارة من الرسوم البيانية ، وحتى
المجموعات المواضيعية
على Facebook .
Jupyter Interactive Notebookالنجوم: 5،242 ، فوركس: 2،331
يُعد مُنشئ هذا المستودع منصة للعمل مع البرامج النصية بأربعين لغة برمجة
Data Data iPython Notebooks ، مع أكثر من 14000 نجم و 4000 شوك. وقد استخدمها المتخصصون في معالجة البيانات والتعلم الآلي في الحوسبة العلمية.
اليوم ، يعد Jupyter Notebook مجموعة مناسبة من ملفات دفتر الملاحظات التي تتكون من فقرات يتم فيها كتابة الطلبات وتنفيذها. باستخدام المرئيات المدمجة ، تتحول المفكرة مع مجموعة من الاستعلامات إلى لوحة معلومات كاملة.
مدونات علوم البياناتالنجوم: 4 510 ، فوركس: 1 178
قائمة بسيطة ولكنها واسعة من المواد التدريبية ، مرتبة أبجديًا. ستجد هنا جميع المدونات الشهيرة ، بالإضافة إلى العديد من المواقع الصغيرة التي تحتوي على معلومات مفيدة (تم إدراج ما مجموعه 251 موارد).
تخصص علوم البياناتالنجوم: 3 114 ، فوركس: 27 184
مستودع
التعليم لعلوم البيانات بجامعة جونز هوبكنز هو دورة شائعة جدًا من قبل روجر بن وجيف ليك وبرايان كوفو. لكي نكون أكثر دقة ، يشتمل البرنامج التدريبي في تخصص "علوم البيانات" في كورسيرا على عدة دورات مترابطة حول مواضيع مختلفة (على سبيل المثال ، برمجة R) تتعلق بمختلف جوانب تحليل البيانات ، ويجمع المستودع المقدم في المجموعة بين المعلومات المستخدمة في جميع الدورات.
شرارة دفترالنجوم: 2 677 ، فوركس: 587
Spark Notebook هو مفكرة مفتوحة المصدر توفر محررًا تفاعليًا على الويب يمكنه دمج كود Scala واستعلامات SQL و Markup و JavaScript لتحليل البيانات واستكشافها معًا.
تعلم علم البياناتالنجوم: 2 129 ، فوركس: 1 210
مجموعة من دفاتر iPython التي تركز على مفاهيم التعلم الآلي الأساسية للمبتدئين.
علم البيانات في سطر الأوامرالنجوم: 2 057 ، فوركس: 503
يحتوي المستودع على نصوص وبيانات وبرامج نصية وأدوات مستخدم وحدة التحكم المستخدمة في
علوم البيانات في سطر الأوامر . يوضح هذا الدليل العملي كيفية الجمع بين أدوات سطر الأوامر الصغيرة ولكن القوية لاسترداد بيانات النموذج وتطهيرها والبحث عنها بسرعة.
موقع مجتمع علوم البيانات التخصصيالنجوم: 1 395 ، فوركس: 2 661
قام العديد من الطلاب الذين أكملوا الدورة في جامعة جونز هوبكنز بإنشاء محتوى عالي الجودة شاركه موظفو الجامعة فيه ، كما قاموا بعمل فهرس لجميع المحتويات المثيرة للاهتمام التي أنشأها المجتمع.
التصور البيانات للويب
D3النجوم: 81 837 ، فوركس: 20 282
D3 هي مكتبة لتصور بيانات JavaScript لـ HTML و SVG. في D3 ، ينصب التركيز على معايير الويب ، بحيث يمكنك استخدام جميع إمكانات المتصفحات الحديثة دون ربط نفسك بهيكل خاص ، والجمع بين مكونات التصور القوية ، نهج تسيطر عليها والتفاعل مع
طراز كائن المستند (DOM) . هذا هو مشروع التصور البيانات الأكثر شعبية على جيثب.
Chart.jsالنجوم: 41393 ، فوركس: 9،294
Chart.js هي مكتبة HTML5 تنشئ تصورات من خلال عنصر <canvas>. يضع Chart.js نفسه كأداة بسيطة ومرنة وتفاعلية تدعم ستة أنواع مختلفة من المخططات.
Ehartsالنجوم: 32 204 ، فوركس: 9،369
ECharts هي مكتبة قائمة على المتصفح للرسم والتصور. سهلة الاستخدام ، بديهية وسهلة التكوين.
النشرةالنجوم: 2310 ، فوركس: 3937
مكتبة JavaScript لإنشاء خرائط تفاعلية تركز على تطبيقات الجوال. رمز المكتبة صغير بشكل لا يصدق - تم تصميمه للاستخدام البسيط والسريع والمريح. يمكن توسيع ميزات المنشور من خلال مجموعة من الإضافات.
Sigma.jsالنجوم: 8348 ، فوركس: 1305
الرسم البياني JS مكتبة المنحى. يسمح لك Sigma بتطوير تمثيلات الرسم البياني على صفحات الويب ودمجها في تطبيقات الويب.
فيغاالنجوم: 6559 ، فوركس: 702
Vega هي لغة تعريفية لإنشاء وحفظ ومشاركة مشاريع التصور التفاعلي. باستخدامه ، يمكنك وصف مظهر التصور وسلوكه التفاعلي بتنسيق JSON ، بالإضافة إلى إنشاء طرق عرض على الويب باستخدام Canvas أو SVG. توفر Vega اللبنات الأساسية لمجموعة واسعة من مشاريع التصور: تحميل البيانات وتحويلها ، والتدرج ، وإسقاطات الخريطة ، والأساطير ، والتسميات الرسومية ، إلخ.
DC.jsالنجوم: 6،458 ، فوركس: 1734
DC.js هو مخطط متعدد الأبعاد مبني على D3.js للعمل مع
عامل التصفية المتقاطعة . يتم عرض DC.js بتنسيق SVG متوافق مع CSS. مصمم لتحليل بيانات قوي في المتصفح وعلى الأجهزة المحمولة.
عصرالنجوم: 4949 ، فوركس: 290
مكتبة التصور في الوقت الحقيقي العالمي. إنه يركز على جانبين مختلفين: المخططات الأساسية لإنشاء تقارير تاريخية ومخططات في الوقت الفعلي لعرض بيانات السلاسل الزمنية التي يتم تحديثها بشكل متكرر.
التعلم العميق
كراسالنجوم: 37611 ، فوركس: 14344
Keras هي مكتبة بيثون للتعلم العميق تستخدمها كل من TensorFlow و Theano (نعم ، يمكنك تشغيلها أعلى
مكتبات TensorFlow و
Theano و
CNTK ). تم تصميم Keras للتجربة السريعة ، حيث أن مفتاح إجراء الأبحاث الجيدة هو القدرة على الانتقال من الفكرة إلى النتيجة الأقل تأخيرًا. بفضل الوثائق الشاملة التي يمكن الوصول إليها ، تحتل Keras بحق مكانًا في اختيارنا.
كافيهالنجوم: 26892 ، فوركس: 16276
يعتبر Caffe (Convolution Architecture For Extraction Feature) مكتبة تعليمية عميقة تربط بيثون و MATLAB. في الواقع ، هي مكتبة للأغراض العامة مصممة لنشر الشبكات التلافيفية وللتعرف على الصور أو الكلام أو الوسائط المتعددة.
يوجد أيضًا مشروع Caffe2 ، والذي يتضمن ميزات جديدة ، خاصة الشبكات العصبية المتكررة. في مايو 2018 ، تم دمج فرق Caffe2 و PyTorch ، تم نقل كود Caffe2 إلى
مستودع PyTorch (النجوم:
24،075 ، الشوك:
5،707 ).
MXNetالنجوم: 16157 ، فوركس: 5824
بيئة تعليمية عميقة وخفيفة الوزن ومدمجة وموزعة بمرونة لبيثون ، آر ، جوليا ، سكالا ، جو ، جافا سكريبت ، إلخ. لمزيد من الأداء ، تسمح لك MXNet بمزج طرق البرمجة الضرورية والرمزية. يحتوي المشروع أيضًا على إرشادات لإنشاء أنظمة تعلم عميقة أخرى.
علوم البيانات IPython الدفاترالنجوم: 14،747 ، فوركس: 4،410
يتم تغطية مجموعة من أجهزة الكمبيوتر المحمولة iPython ، بما في ذلك البيانات الضخمة ، Hadoop ، scikit-learn ، والمكتبات المصممة للحوسبة العلمية ، وما إلى ذلك. التحدث عن التعلم العميق ، TensorFlow ، Theano ، Caffe وغيرها من الأدوات.
Convnetjsالنجوم: 9510 ، فوركس: 1،982
ConvNetJS هو تطبيق للشبكات العصبية ووحدات جافا سكريبت الشائعة الخاصة بها. المشروع غير مدعوم حاليًا ، لكنه لا يزال يستحق الاهتمام. يتيح لك تعلم الشبكات التلافيفية (أو العادية) مباشرة في المتصفح.
Deeplearning4jالنجوم: 10،227 ، فوركس: 4570
مكتبة التعلم العميق لجافا وسكالا. يتكامل مع Hadoop و Spark. يتيح Deeplearning4j أيضًا حوسبة GPU التي تدعم CUDA. بالإضافة إلى ذلك ، هناك أدوات للعمل مع المكتبة في بيثون. يحتوي المستودع على جميع الوثائق والبرامج التعليمية اللازمة.
ليزا مختبر التعلم العميق الدروسالنجوم: 3،673 ، فوركس: 2045
مجموعة من الكتب المدرسية من جامعة مونتريال. تقدم المادة المعروضة هنا بعضًا من أهم خوارزميات التعلم العميق ، كما توضح مبدأ العمل مع Theano. Theano هي مكتبة بيثون تعمل على تبسيط كتابة نماذج التعلم العميق وتتيح تدريبهم على وحدة معالجة الرسومات.
مع هذه القائمة ، لا يقتصر عدد الأشياء المثيرة للاهتمام على جيثب. في المرة القادمة سوف نتحدث عن مشاريع التعلم الآلي ومجموعات البيانات المفتوحة. إذا كان لديك أمثلة خاصة بك من مستودعات مثيرة للاهتمام ، فشاركها في التعليقات.