جيثب آخر: مستودعات علوم البيانات وتصور البيانات والتعلم العميق


( ج )

إن Github ليس مجرد منصة للاستضافة والتطوير المشترك لمشاريع تكنولوجيا المعلومات ، ولكنه أيضًا قاعدة معارف ضخمة جمعها مئات الخبراء. لحسن الحظ ، لا توفر الخدمة أدوات للعمل فقط مع شفرة مفتوحة المصدر ، ولكن أيضًا مواد عالية الجودة للتدريب. اخترنا بعض المستودعات الشائعة وفرزناها حسب عدد النجوم بالترتيب التنازلي.

ستساعدك هذه المجموعة في معرفة المستودعات التي يجب أن تنتبه إليها إذا كنت مهتمًا بالعمل مع البيانات والتدريب المتعمق.

علم البيانات


الماجستير المفتوح المصدر لعلوم البيانات
النجوم: 11227 ، فوركس: 4،737

المستودع الرسمي لمنهج الماجستير في علوم البيانات ، تم تطويره كبديل مفتوح المصدر للتعليم الرسمي في مجال علوم البيانات. المستودع عبارة عن مجموعة من المواد التدريبية التي تم جمعها على مدار عدة سنوات.

علم البيانات رهيبة
النجوم: 9،240 ، فوركس: 2،761

مجموعة قوية تجيب على الأسئلة: "ما هي علوم البيانات؟" و "ما تحتاج إلى معرفته حتى تكون على دراية جيدة بهذا العلم؟". تنقسم بسهولة إلى فئات. على سبيل المثال ، هناك قائمة بالكتب حول علوم البيانات ، ومجموعة مختارة من الرسوم البيانية ، وحتى المجموعات المواضيعية على Facebook .

Jupyter Interactive Notebook
النجوم: 5،242 ، فوركس: 2،331

يُعد مُنشئ هذا المستودع منصة للعمل مع البرامج النصية بأربعين لغة برمجة Data Data iPython Notebooks ، مع أكثر من 14000 نجم و 4000 شوك. وقد استخدمها المتخصصون في معالجة البيانات والتعلم الآلي في الحوسبة العلمية.

اليوم ، يعد Jupyter Notebook مجموعة مناسبة من ملفات دفتر الملاحظات التي تتكون من فقرات يتم فيها كتابة الطلبات وتنفيذها. باستخدام المرئيات المدمجة ، تتحول المفكرة مع مجموعة من الاستعلامات إلى لوحة معلومات كاملة.

مدونات علوم البيانات
النجوم: 4 510 ، فوركس: 1 178

قائمة بسيطة ولكنها واسعة من المواد التدريبية ، مرتبة أبجديًا. ستجد هنا جميع المدونات الشهيرة ، بالإضافة إلى العديد من المواقع الصغيرة التي تحتوي على معلومات مفيدة (تم إدراج ما مجموعه 251 موارد).

تخصص علوم البيانات
النجوم: 3 114 ، فوركس: 27 184

مستودع التعليم لعلوم البيانات بجامعة جونز هوبكنز هو دورة شائعة جدًا من قبل روجر بن وجيف ليك وبرايان كوفو. لكي نكون أكثر دقة ، يشتمل البرنامج التدريبي في تخصص "علوم البيانات" في كورسيرا على عدة دورات مترابطة حول مواضيع مختلفة (على سبيل المثال ، برمجة R) تتعلق بمختلف جوانب تحليل البيانات ، ويجمع المستودع المقدم في المجموعة بين المعلومات المستخدمة في جميع الدورات.

شرارة دفتر
النجوم: 2 677 ، فوركس: 587

Spark Notebook هو مفكرة مفتوحة المصدر توفر محررًا تفاعليًا على الويب يمكنه دمج كود Scala واستعلامات SQL و Markup و JavaScript لتحليل البيانات واستكشافها معًا.

تعلم علم البيانات
النجوم: 2 129 ، فوركس: 1 210

مجموعة من دفاتر iPython التي تركز على مفاهيم التعلم الآلي الأساسية للمبتدئين.

علم البيانات في سطر الأوامر
النجوم: 2 057 ، فوركس: 503

يحتوي المستودع على نصوص وبيانات وبرامج نصية وأدوات مستخدم وحدة التحكم المستخدمة في علوم البيانات في سطر الأوامر . يوضح هذا الدليل العملي كيفية الجمع بين أدوات سطر الأوامر الصغيرة ولكن القوية لاسترداد بيانات النموذج وتطهيرها والبحث عنها بسرعة.

موقع مجتمع علوم البيانات التخصصي
النجوم: 1 395 ، فوركس: 2 661

قام العديد من الطلاب الذين أكملوا الدورة في جامعة جونز هوبكنز بإنشاء محتوى عالي الجودة شاركه موظفو الجامعة فيه ، كما قاموا بعمل فهرس لجميع المحتويات المثيرة للاهتمام التي أنشأها المجتمع.

التصور البيانات للويب


D3
النجوم: 81 837 ، فوركس: 20 282

D3 هي مكتبة لتصور بيانات JavaScript لـ HTML و SVG. في D3 ، ينصب التركيز على معايير الويب ، بحيث يمكنك استخدام جميع إمكانات المتصفحات الحديثة دون ربط نفسك بهيكل خاص ، والجمع بين مكونات التصور القوية ، نهج تسيطر عليها والتفاعل مع طراز كائن المستند (DOM) . هذا هو مشروع التصور البيانات الأكثر شعبية على جيثب.

Chart.js
النجوم: 41393 ، فوركس: 9،294

Chart.js هي مكتبة HTML5 تنشئ تصورات من خلال عنصر <canvas>. يضع Chart.js نفسه كأداة بسيطة ومرنة وتفاعلية تدعم ستة أنواع مختلفة من المخططات.

Eharts
النجوم: 32 204 ، فوركس: 9،369

ECharts هي مكتبة قائمة على المتصفح للرسم والتصور. سهلة الاستخدام ، بديهية وسهلة التكوين.

النشرة
النجوم: 2310 ، فوركس: 3937

مكتبة JavaScript لإنشاء خرائط تفاعلية تركز على تطبيقات الجوال. رمز المكتبة صغير بشكل لا يصدق - تم تصميمه للاستخدام البسيط والسريع والمريح. يمكن توسيع ميزات المنشور من خلال مجموعة من الإضافات.

Sigma.js
النجوم: 8348 ، فوركس: 1305

الرسم البياني JS مكتبة المنحى. يسمح لك Sigma بتطوير تمثيلات الرسم البياني على صفحات الويب ودمجها في تطبيقات الويب.

فيغا
النجوم: 6559 ، فوركس: 702

Vega هي لغة تعريفية لإنشاء وحفظ ومشاركة مشاريع التصور التفاعلي. باستخدامه ، يمكنك وصف مظهر التصور وسلوكه التفاعلي بتنسيق JSON ، بالإضافة إلى إنشاء طرق عرض على الويب باستخدام Canvas أو SVG. توفر Vega اللبنات الأساسية لمجموعة واسعة من مشاريع التصور: تحميل البيانات وتحويلها ، والتدرج ، وإسقاطات الخريطة ، والأساطير ، والتسميات الرسومية ، إلخ.

DC.js
النجوم: 6،458 ، فوركس: 1734

DC.js هو مخطط متعدد الأبعاد مبني على D3.js للعمل مع عامل التصفية المتقاطعة . يتم عرض DC.js بتنسيق SVG متوافق مع CSS. مصمم لتحليل بيانات قوي في المتصفح وعلى الأجهزة المحمولة.

عصر
النجوم: 4949 ، فوركس: 290

مكتبة التصور في الوقت الحقيقي العالمي. إنه يركز على جانبين مختلفين: المخططات الأساسية لإنشاء تقارير تاريخية ومخططات في الوقت الفعلي لعرض بيانات السلاسل الزمنية التي يتم تحديثها بشكل متكرر.

التعلم العميق


كراس
النجوم: 37611 ، فوركس: 14344

Keras هي مكتبة بيثون للتعلم العميق تستخدمها كل من TensorFlow و Theano (نعم ، يمكنك تشغيلها أعلى مكتبات TensorFlow و Theano و CNTK ). تم تصميم Keras للتجربة السريعة ، حيث أن مفتاح إجراء الأبحاث الجيدة هو القدرة على الانتقال من الفكرة إلى النتيجة الأقل تأخيرًا. بفضل الوثائق الشاملة التي يمكن الوصول إليها ، تحتل Keras بحق مكانًا في اختيارنا.

كافيه
النجوم: 26892 ، فوركس: 16276

يعتبر Caffe (Convolution Architecture For Extraction Feature) مكتبة تعليمية عميقة تربط بيثون و MATLAB. في الواقع ، هي مكتبة للأغراض العامة مصممة لنشر الشبكات التلافيفية وللتعرف على الصور أو الكلام أو الوسائط المتعددة.

يوجد أيضًا مشروع Caffe2 ، والذي يتضمن ميزات جديدة ، خاصة الشبكات العصبية المتكررة. في مايو 2018 ، تم دمج فرق Caffe2 و PyTorch ، تم نقل كود Caffe2 إلى مستودع PyTorch (النجوم: 24،075 ، الشوك: 5،707 ).

MXNet
النجوم: 16157 ، فوركس: 5824

بيئة تعليمية عميقة وخفيفة الوزن ومدمجة وموزعة بمرونة لبيثون ، آر ، جوليا ، سكالا ، جو ، جافا سكريبت ، إلخ. لمزيد من الأداء ، تسمح لك MXNet بمزج طرق البرمجة الضرورية والرمزية. يحتوي المشروع أيضًا على إرشادات لإنشاء أنظمة تعلم عميقة أخرى.

علوم البيانات IPython الدفاتر
النجوم: 14،747 ، فوركس: 4،410

يتم تغطية مجموعة من أجهزة الكمبيوتر المحمولة iPython ، بما في ذلك البيانات الضخمة ، Hadoop ، scikit-learn ، والمكتبات المصممة للحوسبة العلمية ، وما إلى ذلك. التحدث عن التعلم العميق ، TensorFlow ، Theano ، Caffe وغيرها من الأدوات.

Convnetjs
النجوم: 9510 ، فوركس: 1،982

ConvNetJS هو تطبيق للشبكات العصبية ووحدات جافا سكريبت الشائعة الخاصة بها. المشروع غير مدعوم حاليًا ، لكنه لا يزال يستحق الاهتمام. يتيح لك تعلم الشبكات التلافيفية (أو العادية) مباشرة في المتصفح.

Deeplearning4j
النجوم: 10،227 ، فوركس: 4570

مكتبة التعلم العميق لجافا وسكالا. يتكامل مع Hadoop و Spark. يتيح Deeplearning4j أيضًا حوسبة GPU التي تدعم CUDA. بالإضافة إلى ذلك ، هناك أدوات للعمل مع المكتبة في بيثون. يحتوي المستودع على جميع الوثائق والبرامج التعليمية اللازمة.

ليزا مختبر التعلم العميق الدروس
النجوم: 3،673 ، فوركس: 2045

مجموعة من الكتب المدرسية من جامعة مونتريال. تقدم المادة المعروضة هنا بعضًا من أهم خوارزميات التعلم العميق ، كما توضح مبدأ العمل مع Theano. Theano هي مكتبة بيثون تعمل على تبسيط كتابة نماذج التعلم العميق وتتيح تدريبهم على وحدة معالجة الرسومات.

مع هذه القائمة ، لا يقتصر عدد الأشياء المثيرة للاهتمام على جيثب. في المرة القادمة سوف نتحدث عن مشاريع التعلم الآلي ومجموعات البيانات المفتوحة. إذا كان لديك أمثلة خاصة بك من مستودعات مثيرة للاهتمام ، فشاركها في التعليقات.

Source: https://habr.com/ru/post/ar437940/


All Articles