بيثون ص ص - علم البيانات

عند التفكير في أفضل لغة برمجة لاستخدامها في علوم البيانات ، يقرع Python و R جرسًا (سريعًا جدًا). في حين أن هناك الكثير من اللغات مثل C و C ++ و Java و Julia و Perl و Scala ، إلا أنها محمية للحماية من أن Python و R هما العاملان الأساسيان في علم البيانات.

في حين سيناقش الكثير من الباحثين في البيانات أوجه القصور المعتادة مثل نزاع البيانات في البحث أو تمثيل البيانات في بيثون ، فإن التحسينات المستمرة مثل Altair for Python أو R قد تفاعلت بشكل كافٍ مع هذه العيوب.

إذن أيها ستكون فكرة جيدة بالنسبة لك أن تقرر مشروع بحث البيانات التالي؟

لقد كان R يحكم هذا الفضاء لفترة طويلة الآن. هذا يبشر بالخير كما تم تصميم لغة البرمجة هذه صراحة للمحللين.

أيضًا ، يتم دعمها بواسطة عدد كبير من الحزم التي تتكامل مع لغات البرمجة المصاحبة بلا عيب:

  • C
  • C ++
  • جافا

بعد مرور أكثر من عقدين على ارتفاعه في البداية ، تم تبني "آر" على نطاق واسع عبر المشاريع من Google إلى وول ستريت كخيار قوي على عكس SAS و Matlab. ومع ذلك ، في الآونة الأخيرة ، كانت هناك زيادة كبيرة في اختيار بيثون من قبل الباحثين البيانات.

هذا الفضل يمكن أن يعزى إلى الطريقة التي توفر بها بيثون الكثير من الظروف المواتية التي تبت فيها قرارًا صعبًا بالنسبة للبعض داخل قطاع الابتكار.

وأيد هذا غيدو فان روسوم ، صانع بيثون ، الذي قال "لدي هذا التوقع بأن هناك طريقة متفوقة. ستكون الأجهزة ذات المستوى الأعلى التي منحتك حقًا فرصة لرؤية هيكل المنتج أكثر وضوحًا من قيمتها الهائلة. "

تقديم الدفاع عن بيثون


من المعروف أن بيثون بسيطة للغاية في التعلم والاستفادة من بنيتها اللغوية المميزة. إنها أيضًا لغة لا تصدق لزيادة العرض التقديمي المهم لعلم البيانات مع تحديث بصرك وتجربتك.

أيضا ، Python هي لغة برمجة مفيدة على نطاق واسع ، وبالتالي ، قد يتم تعديلها بشكل جيد للغاية لرعاية أي مشكلة محتملة. بغض النظر عما إذا كانت تشارك في استخراج البيانات أو بناء إدارات الويب ، يمكنك استخدام Python لرعاية القضايا المتعلقة بالبيانات من البداية إلى النهاية.

للتعرف على الاستثناءات في مجموعة البيانات ، يمكن لكل من Python و R الاهتمام بالأعمال بشكل منتج. مهما كان الأمر ، في فرصة الخروج التي تحتاجها لإنشاء إدارة ويب تمكن الآخرين من اكتشاف الحالات الشاذة في مجموعات البيانات ، فإن بيثون هي أفضل قرار.

يمكنك القول أن بيثون مؤهل أكثر للتعلم العميق (DL). هذا على أساس أنها مدعومة بحزم مثل Keras و TensorFlow و Theano التي تجعل من صنع أنظمة عصبية عميقة إجراءً ثابتًا.

بالإضافة إلى ذلك ، فيما يتعلق بدعم DL ، تقدم بيثون غالبًا. بالإضافة إلى ذلك ، هناك بالإضافة إلى ذلك شبكة نامية عملاقة تضم بالمثل العديد من شبكة علوم البيانات.

وضع الدفاع عن ر


R لا يصدق على أساس أن حزمًا مثل CRAN ترافق مجموعة كبيرة من الأجهزة الواقعية وحسابات AI (ML). أيضا ، يمكن الوصول إلى R بشكل فعال مع C ++ بمساعدة Rcpp.

تمامًا مثل Scikit-Learn في Python ، تجعل حزمة Caret بالمثل من استخدام الحسابات المختلفة داخل واجهة فردية. أيضا ، RStudio يعطي شرط النهوض الحكم الذاتي الهائل (IDE).

فيما يتعلق بتمثيل البيانات ، تبرز R بنطاقها المذهل من أدوات الإدراك مثل المرافق:

  • ggplot2
  • googleVis
  • rCharts

على الرغم من ذلك ، في حين أن Python لا تتماشى مع R فيما يتعلق بالإدراك ، فإن لغة البرمجة لديها نطاق واسع من مكتبات التمثيل المذهلة مثل Matplotlib و Seaborn.

إذن ما هي أفضل لغة برمجة لعلم البيانات؟

وفقًا لريكاردو فلاديميرو ، رائد علوم البيانات في Miniclip ، لا يوجد بالتأكيد قرار متفوق. في حين أن بيثون هي لغة البرمجة المفضلة لديه ، يتم ترميزه يومًا بيومًا في R.

اختيار واحد على الآخر يعتمد بشكل كبير على هدف التعهد.

في Intersog ، يقبل باحثو البيانات لدينا أن الأمر يتعلق بمجموعتك المعتادة من الألفة. لذلك ، إذا كنت من مؤسسة هندسة برمجيات وتشعر بالانفتاح على نحو متزايد للعمل مع بيثون ، فهذا هو أفضل قرار لك في هذه المرحلة.

ومع ذلك ، في حال كنت محللًا أو خبيرًا في مجال البيانات حسب المهنة ، فمن المحتمل أن يكون R قرارًا طبيعيًا على نحو متزايد. في Techmango ، نعتز بـ R ، لكن من ناحية أخرى ، نعلم أننا نستخدم Python مبلغًا كبيرًا.

هل تبحث لإشراك شركة لتطوير البرمجيات والتطبيقات مثل Techmango لمشروع البيانات الضخم القادم؟ التقط هنا للتخطيط لمناقشة حرة مع أحد أفضل الباحثين في مجال البيانات لدينا.

Source: https://habr.com/ru/post/ar462035/


All Articles