أولئك الذين يعملون مع البيانات يدركون جيدًا أن السعادة ليست في الشبكة العصبية ، ولكن في كيفية معالجة البيانات بشكل صحيح. ولكن من أجل معالجتها ، يجب عليك أولاً تحليل الارتباطات ، وتحديد البيانات اللازمة ، والتخلص من البيانات غير الضرورية ، وما إلى ذلك. لهذه الأغراض ، غالبًا ما يتم استخدام التصور باستخدام مكتبة matplotlib.

قابلني "من الداخل"!
تعديل
قم بتشغيل الكود التالي لتكوينه. المخططات الفردية ، ومع ذلك ، تجاوز إعداداتها أنفسهم.
ارتباط
تُستخدم مخططات الارتباط لتصور العلاقة بين متغيرين أو أكثر. وهذا هو ، كيف يتغير متغير واحد بالنسبة إلى آخر.
1. مؤامرة مبعثر
Scatteplot هو عرض مخطط كلاسيكي وأساسي يستخدم لفحص العلاقة بين متغيرين. إذا كان لديك عدة مجموعات في بياناتك ، فيمكنك تصور كل مجموعة بلون مختلف. في matplotlib يمكنك القيام بذلك بسهولة باستخدام plt.scatterplot ().

2. الرسم البياني فقاعة مع القبض على المجموعة
في بعض الأحيان تريد إظهار مجموعة من النقاط داخل الحدود للتأكيد على أهميتها. في هذا المثال ، نحصل على السجلات من إطار البيانات الذي ينبغي تخصيصه ، ونمررها إلى تطويق () الموضح في الكود أدناه.
إظهار الرمز from matplotlib import patches from scipy.spatial import ConvexHull import warnings; warnings.simplefilter('ignore') sns.set_style("white")

3. أفضل تناسب الرسم البياني الانحدار الخطي
إذا كنت تريد أن تفهم كيف يتغير متغيرين بالنسبة لبعضهما البعض ، فإن أفضل خط ملاءمة هو الأفضل. يوضح الرسم البياني أدناه أفضل طريقة للتوافق بين مجموعات البيانات المختلفة. لتعطيل المجموعات ورسم سطر واحد يناسب مجموعة البيانات بأكملها ، قم بإزالة المعلمة hue = 'cyl' من sns.lmplot () أدناه.

كل صف الانحدار في العمود الخاص به
بالإضافة إلى ذلك ، يمكنك إظهار أفضل خط ملائم لكل مجموعة في عمود منفصل. تريد القيام بذلك عن طريق تعيين col = معامل groupingcolumn داخل sns.lmplot ().

4. Stripplot
غالبًا ما تحتوي نقاط بيانات متعددة على نفس القيم X و Y. ونتيجة لذلك ، يتم رسم نقاط بيانات متعددة فوق بعضها البعض وإخفائها. لتجنب هذا الأمر ، انقل النقاط متباعدة قليلاً حتى تتمكن من رؤيتها بصريًا. يتم ذلك بسهولة باستخدام stripplot ().

5. عد المؤامرة
هناك خيار آخر يتجنب مشكلة نقاط التداخل وهو زيادة حجم النقطة ، اعتمادًا على عدد النقاط الموجودة في هذا المكان. وبالتالي ، كلما كانت النقطة أكبر ، زاد تركيز النقاط حولها.

6. شريط الرسم البياني
تحتوي الرسوم البيانية الخطية على رسم بياني على طول متغيرات المحور X و Y. يتم استخدامه لتصور العلاقة بين X و Y مع التوزيع أحادي البعد X و Y بشكل فردي. غالبًا ما يستخدم هذا الرسم البياني في تحليل البيانات (EDA).

7. Boxplot
يخدم Boxplot نفس الغرض من رسم بياني سطري. ومع ذلك ، فإن هذا الرسم البياني يساعد في تحديد المتوسطات المئوية ، 25 و 75 من X و Y.

8. مخطط الارتباط
يتم استخدام مخطط الارتباط لعرض بصري قياس الارتباط بين جميع الأزواج الممكنة من المتغيرات الرقمية في مجموعة بيانات معينة (أو صفيف ثنائي الأبعاد).

9. جدول الزوج
يستخدم غالبًا في تحليل البحث لفهم العلاقة بين جميع الأزواج الممكنة للمتغيرات الرقمية. هذا هو أداة يجب أن يكون لتحليل ثنائي الأبعاد.


الانحراف
10. تباعد الأعمدة
إذا كنت تريد أن ترى كيف تتغير العناصر وفقًا لمقياس واحد ، وتصور ترتيب وحجم هذا التشتت ، فإن الأعمدة المتباعدة هي أداة رائعة. إنه يساعد على التمييز بسرعة بين أداء المجموعات في بياناتك ، وهو بديهي تمامًا وينقل المعنى على الفور.

11. تباعد الأعمدة مع النص
- تبدو وكأنها أعمدة متباعدة ، وهذا هو الأفضل إذا كنت ترغب في إظهار أهمية كل عنصر في المخطط بطريقة جيدة وعصرية.

12. نقاط متباعدة
يشبه الرسم البياني للنقاط المتباعدة أيضًا الأعمدة المتباعدة. ومع ذلك ، بالمقارنة مع الأعمدة المتباينة ، فإن عدم وجود أعمدة يقلل من درجة التباين والتناقض بين المجموعتين.

13. تباعد مخطط المصاصة مع علامات
يوفر Lollipop طريقة مرنة لتصور التناقضات ، مع التركيز على أي نقاط بيانات ذات صلة تريد الانتباه إليها.

14. مخطط المنطقة
تلوين المنطقة بين المحور والخطوط ، يؤكد مخطط المساحة على القمم والحدود ، ولكن أيضًا على مدة القمم والهبوط. أطول المرتفعات ، أكبر مساحة تحت الخط.
إظهار الرمز import numpy as np import pandas as pd

تصنيف
15. طلب رسم بياني
رسم بياني أمر ينقل بشكل فعال ترتيب ترتيب العناصر. ولكن عن طريق إضافة قيمة مترية أعلى المخطط ، يتلقى المستخدم معلومات دقيقة من المخطط نفسه.

16. الرسم البياني المصاصة
يخدم مخطط Lollipop غرضًا مشابهًا للرسم البياني المرتقب بطريقة مبهجة.

17. منقط الرسم البياني مع التوقيعات
مؤامرة مبعثر ينقل ترتيب العناصر. ونظرًا لأنه محاذٍ على طول المحور الأفقي ، يمكنك تقييم مدى المسافة عن بعضها البعض بصريًا.

18. خريطة مائلة
يعد مخطط الميل أكثر ملاءمة لمقارنة وضعي "قبل" و "بعد" لشخص / موضوع معين.
إظهار الرمز import matplotlib.lines as mlines

19. "الدمبل"
ينقل الرسم البياني "الدمبل" المواضع "السابقة" و "بعد" للتأثيرات المختلفة ، وكذلك ترتيب ترتيب العناصر. يعد هذا مفيدًا جدًا إذا كنت ترغب في تصور تأثير شيء ما على كائنات مختلفة.
إظهار الرمز import matplotlib.lines as mlines

توزيع
20. المدرج التكراري لمتغير مستمر
يوضح الرسم البياني توزيع التردد لهذا المتغير. يجمع العرض التقديمي التالي نطاقات التردد استنادًا إلى متغير قاطع.

21. الرسم البياني للمتغير القاطع
يوضح الرسم البياني للمتغير القاطع توزيع التردد لهذا المتغير. عن طريق تلوين الأعمدة ، يمكنك تصور التوزيع بالنسبة إلى متغير فئة آخر يمثل الألوان.

22. كثافة الرسم البياني
الرسوم البيانية الكثافة هي أداة تستخدم على نطاق واسع لتصور توزيع متغير مستمر. بعد تجميعها حسب "الاستجابة" المتغيرة ، يمكنك التحقق من العلاقة بين X و Y. وفيما يلي مثال على ذلك ، لوصفنا ، لوصفنا كيف يختلف توزيع الأميال في المدينة وفقًا لعدد الأسطوانات.

23.
, , .

24. Joy
Joy , . .

25.
, . , . - , .
import matplotlib.patches as mpatches

26.
— , , 25-, 75- . , , . , .
, , 5 47 . .

27.
Dot + Box plot , boxplot, . , .

28. «»
— boxplot. «» . , , .

29.
, , , , , , .

30.
, seaborn, .


,
31.
waffle pywaffle .


32.
— . , , , , . , , .


33.
, .

34.
— . , , . all_colors . , color .plt.plot()

35.
, . , 1949 1969 .

36.
.

37. (ACF) (PACF)
ACF . ( ) , 0. . , , .
?
AirPassengers , x=14 «» , , . , , 14 , , .
PACF, , ( ) , .
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

38. -
.
import statsmodels.tsa.stattools as stattools

39.
, .
from statsmodels.tsa.seasonal import seasonal_decompose from dateutil.parser import parse

40.
, , .

41. Y
, , Y .

42.
, ( / ). , . , 45 .
. 95% - .
from scipy.stats import sem

"Data Source: https://www.kaggle.com/olistbr/brazilian-ecommerce#olist_orders_dataset.csv" from dateutil.parser import parse from scipy.stats import sem

43.
.

44. Unstacked
( ) . , . .

45.
. , .
import matplotlib as mpl import calmap

46.
, ( / / . .).
from dateutil.parser import parse

47.
.
import scipy.cluster.hierarchy as shc

48.
, . 5 USArrests. «» «» X Y. X Y.
from sklearn.cluster import AgglomerativeClustering from scipy.spatial import ConvexHull

49.
, , . ( ) , ,
from pandas.plotting import andrews_curves

50.
, . , , , .
from pandas.plotting import parallel_coordinates

,