рдХреНрдпрд╛ рдЖрдкрдиреЗ рдЕрдкрдиреЗ рдлреНрд▓реИрдЯ рдХреА рдХреАрдордд рдХреЗ рд▓рд┐рдП рдирд┐рдХрдЯрддрдо рдореЗрдЯреНрд░реЛ рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕реЛрдЪрд╛ рд╣реИ?
рдЖрдкрдХреЗ рдЕрдкрд╛рд░реНрдЯрдореЗрдВрдЯ рдХреЗ рдЖрд╕рдкрд╛рд╕ рдХрдИ рдХрд┐рдВрдбрд░рдЧрд╛рд░реНрдЯрди рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХреНрдпрд╛? рдХреНрдпрд╛ рдЖрдк рднреВ-рд╕реНрдерд╛рдирд┐рдХ рдбреЗрдЯрд╛ рдХреА рджреБрдирд┐рдпрд╛ рдореЗрдВ рдЫрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рддреИрдпрд╛рд░ рд╣реИрдВ?
рдЖрдЦрд┐рд░ рдХреНрдпрд╛ рд╣реИ?
рдкрд┐рдЫрд▓реЗ рднрд╛рдЧ рдореЗрдВ , рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдХреБрдЫ рдбреЗрдЯрд╛ рдерд╛ рдФрд░ рдпреЗрдХрд╛рддреЗрд░рд┐рдирдмрд░реНрдЧ рдХреЗ рдПрдХ рд░рд┐рдпрд▓ рдПрд╕реНрдЯреЗрдЯ рдорд╛рд░реНрдХреЗрдЯ рдкрд░ рдПрдХ рдЕрдЪреНрдЫрд╛ рдкрд░реНрдпрд╛рдкреНрдд рдСрдлрд╝рд░ рдЦреЛрдЬрдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреАред
рд╣рдо рдЙрд╕ рдмрд┐рдВрджреБ рдкрд░ рдЖ рдЧрдП рдереЗ рдЬрдм рд╣рдорд╛рд░реЗ рдкрд╛рд╕ 73% рдХреЗ рдкрд╛рд╕ рдХреНрд░реЙрд╕-рд╡реИрд▓рд┐рдбреЗрд╢рди рдкрд░ рд╕рдЯреАрдХрддрд╛ рдереАред рд╣рд╛рд▓рд╛рдБрдХрд┐, рд╣рд░ рд╕рд┐рдХреНрдХреЗ рдХреЗ 2 рдкрд╣рд▓реВ рд╣реЛрддреЗ рд╣реИрдВред рдФрд░ 73% рд╕рдЯреАрдХрддрд╛ рдпрд╣ 27% рддреНрд░реБрдЯрд┐ рд╣реИред рд╣рдо рдЗрд╕реЗ рдХрдо рдХреИрд╕реЗ рдмрдирд╛ рд╕рдХрддреЗ рд╣реИрдВ? рдЕрдЧрд▓рд╛ рдХрджрдо рдХреНрдпрд╛ рд╣реИ?
рд╕реНрдерд╛рдирд┐рдХ рдбреЗрдЯрд╛ рдорджрдж рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖ рд░рд╣рд╛ рд╣реИ
рдкрд░реНрдпрд╛рд╡рд░рдг рд╕реЗ рдЕрдзрд┐рдХ рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХреНрдпрд╛? рд╣рдо рднреВ-рд╕рдВрджрд░реНрдн рдФрд░ рдХреБрдЫ рд╕реНрдерд╛рдирд┐рдХ рдбреЗрдЯрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рд╢рд╛рдпрдж рд╣реА рд▓реЛрдЧ рдЕрдкрдирд╛ рдкреВрд░рд╛ рдЬреАрд╡рди рдШрд░ рдкрд░ рдмрд┐рддрд╛рддреЗ рд╣реИрдВред рдХрднреА-рдХрднреА рд╡реЗ рджреБрдХрд╛рдиреЛрдВ рдкрд░ рдЬрд╛рддреЗ рд╣реИрдВ, рдмрдЪреНрдЪреЛрдВ рдХреЛ рдбреЗрдХреЗрдпрд░ рд╕реЗ рд▓реЗрддреЗ рд╣реИрдВред рдЙрдирдХреЗ рдмрдЪреНрдЪреЗ рдмрдбрд╝реЗ рд╣реЛрдХрд░ рд╕реНрдХреВрд▓, рд╡рд┐рд╢реНрд╡рд╡рд┐рджреНрдпрд╛рд▓рдп рдЖрджрд┐ рдореЗрдВ рдЬрд╛рддреЗ рд╣реИрдВред
рдпрд╛ ... рдХрднреА-рдХрднреА рдЙрдиреНрд╣реЗрдВ рдЪрд┐рдХрд┐рддреНрд╕рд╛ рд╕рд╣рд╛рдпрддрд╛ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ рдФрд░ рд╡реЗ рдЕрд╕реНрдкрддрд╛рд▓ рдХреА рддрд▓рд╛рд╢ рдореЗрдВ рд░рд╣рддреЗ рд╣реИрдВред рдФрд░ рдПрдХ рдмрд╣реБрдд рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рдд рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рдкрд░рд┐рд╡рд╣рди рд╣реИ, рдореЗрдЯреНрд░реЛ рдХрдо рд╕реЗ рдХрдоред рджреВрд╕рд░реЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ, рд╡рд╣рд╛рдБ рдХрдИ рдЪреАрдЬреЗрдВ рд╣реИрдВ, рдЬреЛ рдореВрд▓реНрдп рдирд┐рд░реНрдзрд╛рд░рдг рдкрд░ рдкреНрд░рднрд╛рд╡ рдбрд╛рд▓рддреА рд╣реИрдВред
рдореИрдВ рдЖрдкрдХреЛ рдЙрдирдХреА рдПрдХ рд╕реВрдЪреА рджрд┐рдЦрд╛рддрд╛ рд╣реВрдВ:
- рд╕рд╛рд░реНрд╡рдЬрдирд┐рдХ рдкрд░рд┐рд╡рд╣рди рдардк
- рджреБрдХрд╛рдиреЗрдВ
- рдХрд┐рдВрдбрд░рдЧрд╛рд░реНрдЯрди
- рдЕрд╕реНрдкрддрд╛рд▓ / рдЪрд┐рдХрд┐рддреНрд╕рд╛ рд╕рдВрд╕реНрдерд╛рди
- рд╢реИрдХреНрд╖рд┐рдХ рд╕рдВрд╕реНрдерд╛рди
- рдореЗрдЯреНрд░реЛ
рдирдП рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди
рд╕реЗ рд╡рд╣ рдЬрд╛рдирдХрд╛рд░реА рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рд╡рд┐рднрд┐рдиреНрди рд╕реНрд░реЛрддреЛрдВ , рдореИрдВрдиреЗ рдПрдХ рджреГрд╢реНрдп рдмрдирд╛рдпрд╛ред
рдирдХреНрд╢реЗ рдкрд░ рдХреБрдЫ рдмрд┐рдВрджреБ рд╣реИрдВ рдпреЗрдХ рдРрд░реНрдЯрд┐рдирдмрд░реНрдЧ рдХрд╛ рд╕рдмрд╕реЗ рдкреНрд░рддрд┐рд╖реНрдард┐рдд (рдФрд░ рдорд╣рдВрдЧрд╛) рдЬрд┐рд▓рд╛ред
- рдЖрд░ рдПрдб рдкреЙрдЗрдВрдЯ - рдлреНрд▓реИрдЯ
- рдУ рднрд╛рдЧ рдЧрдпрд╛ - рд░реБрдХ рдЬрд╛рддрд╛ рд╣реИ
- Y ellow - рджреБрдХрд╛рдиреЗрдВ
- рдЬреА рд░реЗрди - рдХрд┐рдВрдбрд░рдЧрд╛рд░реНрдЯрди
- рдмреА рд▓реНрдпреВ - рд╢рд┐рдХреНрд╖рд╛
- рдореИрдВ ndigo - рдЪрд┐рдХрд┐рддреНрд╕рд╛
- рд╡реА реЙрдпрд▓реЗрдЯ - рдореЗрдЯреНрд░реЛ
рд╣рд╛рдБ, рдПрдХ рдЗрдВрджреНрд░рдзрдиреБрд╖ рдпрд╣рд╛рдБ рд╣реИред
рдЕрд╡рд▓реЛрдХрди
рдЕрдм рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдХ рдбреЗрдЯрд╛рд╕реЗрдЯ рд╣реИ рдЬреЛ рдЬрд┐рдпреЛрдбреЗрдЯрд╛ рд╕реЗ рдШрд┐рд░рд╛ рд╣реИ рдФрд░ рдЗрд╕рдореЗрдВ рдХреБрдЫ рдирдИ рдЬрд╛рдирдХрд╛рд░реА рд╣реИ
df.head(10)

df.describe()

рдПрдХ рдЕрдЪреНрдЫрд╛ рдкреБрд░рд╛рдирд╛ рдореЙрдбрд▓
рдкрд╣рд▓реЗ рдХреА рддрд░рд╣ рд╣реА рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ
y = df.cost X = df.drop(columns=['cost']) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,random_state=42)
рдлрд┐рд░ рд╣рдо рдЕрдкрдиреЗ рдореЙрдбрд▓ рдХреЛ рдлрд┐рд░ рд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рддреЗ рд╣реИрдВ, рдЕрдкрдиреА рдЙрдВрдЧрд▓рд┐рдпреЛрдВ рдХреЛ рдкрд╛рд░ рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рдлрд┐рд░ рд╕реЗ рдлреНрд▓реИрдЯ рдХреА рдХреАрдордд рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддреЗ рд╣реИрдВред
from sklearn.linear_model import LinearRegression regressor = LinearRegression() model = regressor.fit(X_train, y_train) do_cross_validation(X_test, y_test, model)

рд╣рдореНрдо ... рдпрд╣ 73% рд╕рдЯреАрдХрддрд╛ рдХреЗ рд╕рд╛рде рдкрд┐рдЫрд▓реЗ рдкрд░рд┐рдгрд╛рдо рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмреЗрд╣рддрд░ рджрд┐рдЦрддрд╛ рд╣реИред
рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреА рдХреЛрд╢рд┐рд╢ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХреНрдпрд╛? рд╣рдорд╛рд░реЗ рдкрд┐рдЫрд▓реЗ рдореЙрдбрд▓ рдореЗрдВ рдлреНрд▓реИрдЯ рдХреАрдордд рдХреЛ рд╕рдордЭрд╛рдиреЗ рдХреА рдХрд╛рдлреА рдЕрдЪреНрдЫреА рдХреНрд╖рдорддрд╛ рдереАред
estimate_model(regressor)

рдУрд╣ ... рд╣рдорд╛рд░рд╛ рдирдпрд╛ рдореЙрдбрд▓ рдкреБрд░рд╛рдиреА рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЗ рд╕рд╛рде рдЕрдЪреНрдЫрд╛ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдирдП рд▓реЛрдЧреЛрдВ рдХреЗ рд╕рд╛рде рд╡реНрдпрд╡рд╣рд╛рд░ рдЕрдЬреАрдм рд▓рдЧрддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд╢реИрдХреНрд╖рд┐рдХ рдпрд╛ рдЪрд┐рдХрд┐рддреНрд╕рд╛ рд╕рдВрд╕реНрдерд╛рдиреЛрдВ рдХреА рдмрдбрд╝реА рд╕рдВрдЦреНрдпрд╛ рдлреНрд▓реИрдЯ рдХреА рдХреАрдордд рдореЗрдВ рдХрдореА рдХреА рдУрд░ рд▓реЗ рдЬрд╛рддреА рд╣реИред рддрджрдиреБрд╕рд╛рд░, рдкрд╛рд╕ рдХреЗ рдлреНрд▓реИрдЯ рдХреА рд╕рдВрдЦреНрдпрд╛ рдПрдХ рд╕рдорд╛рди рд╕реНрдерд┐рддрд┐ рд╣реИ рдФрд░ рдЗрд╕реЗ рдлреНрд▓реИрдЯ рдХреА рдХреАрдордд рдореЗрдВ рдЕрддрд┐рд░рд┐рдХреНрдд рдпреЛрдЧрджрд╛рди рджреЗрдирд╛ рдЪрд╛рд╣рд┐рдПред
рдирдпрд╛ рдореЙрдбрд▓ рдЕрдзрд┐рдХ рд╕рдЯреАрдХ рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдХреЗ рд╕рд╛рде рдлрд┐рдЯ рдирд╣реАрдВ рд╣реИред
рдХреБрдЫ рдЯреВрдЯ рдЧрдпрд╛ рд╣реИ
рдЖрдЗрдП рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВ рдХрд┐ рдХреНрдпрд╛ рд╣реБрдЖред
рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ - рдореИрдВ рдЖрдкрдХреЛ рдпрд╛рдж рджрд┐рд▓рд╛рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдВ рдХрд┐ рд╣рдорд╛рд░реЗ рд░реИрдЦрд┐рдХ рдкреНрд░рддрд┐рдЧрдорди рдХреА рдкреНрд░рдореБрдЦ рд╡рд┐рд╢реЗрд╖рддрд╛ рд╣реИ ... erm ... рд░реИрдЦрд┐рдХрддрд╛ред рд╣рд╛рдВ, рдХреИрдкреНрдЯрди рдУрдмрд░реА рдпрд╣рд╛рдВ рд╣реИрдВред
рдпрджрд┐ рдЖрдкрдХрд╛ рдбреЗрдЯрд╛ рдПрдХ рд╡рд┐рдЪрд╛рд░ рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рд╣реИ "рдмрдбрд╝рд╛ / рдкрдЯреНрдЯреЗ X рдмрдбрд╝рд╛ рд╣реИ / рдкрдЯреНрдЯреЗ Y рд╣реИ" - рд░реИрдЦрд┐рдХ рдкреНрд░рддрд┐рдЧрдорди рдПрдХ рдЕрдЪреНрдЫрд╛ рдЙрдкрдХрд░рдг рд╣реЛрдЧрд╛ред рд▓реЗрдХрд┐рди рдЬрд┐рдпреЛрдбрд╛рдЯрд╛ рд╣рдорд╛рд░реА рдЕрдкреЗрдХреНрд╖рд╛ рд╕реЗ рдЕрдзрд┐рдХ рдЬрдЯрд┐рд▓ рд╣реИред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП:
- рдЬрдм рдЖрдкрдХреЗ рдлреНрд▓реИрдЯ рдХреЗ рдкрд╛рд╕ рдПрдХ рдмрд╕ рд╕реНрдЯреЙрдк рд╣реЛрддрд╛ рд╣реИ рддреЛ рдпрд╣ рдЕрдЪреНрдЫрд╛ рд╣реЛрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЕрдЧрд░ рдЙрдирдХреА рд░рд╛рд╢рд┐ рд▓рдЧрднрдЧ 5 рд╣реИ, рддреЛ рдпрд╣ рдПрдХ рд╢реЛрд░ рд╡рд╛рд▓реА рд╕рдбрд╝рдХ рдХреА рдУрд░ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рд▓реЛрдЧ рдкрд╛рд╕ рдХреЗ рдлреНрд▓реИрдЯ рдХреЛ рдЦрд░реАрджрдиреЗ рд╕реЗ рдмрдЪрдирд╛ рдЪрд╛рд╣реЗрдВрдЧреЗред
- рдпрджрд┐ рдХреЛрдИ рд╡рд┐рд╢реНрд╡рд╡рд┐рджреНрдпрд╛рд▓рдп рд╣реИ, рддреЛ рдЙрд╕рдХреА рдХреАрдордд рдкрд░ рдЕрдЪреНрдЫрд╛ рдкреНрд░рднрд╛рд╡ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП,
рдПрдХ рд╣реА рд╕рдордп рдореЗрдВ рдЖрдкрдХреЗ рдШрд░ рдХреЗ рдкрд╛рд╕ рдЫрд╛рддреНрд░реЛрдВ рдХреА рднреАрдбрд╝ рдмрд╣реБрдд рдкреНрд░рд╕рдиреНрди рдирд╣реАрдВ рд╣реЛрддреА рд╣реИ рдпрджрд┐ рдЖрдк рдмрд╣реБрдд рд╣реА рдорд┐рд▓рдирд╕рд╛рд░ рд╡реНрдпрдХреНрддрд┐ рдирд╣реАрдВ рд╣реИрдВред - рдЖрдкрдХреЗ рдШрд░ рдХреЗ рдкрд╛рд╕ рдореЗрдЯреНрд░реЛ рдЕрдЪреНрдЫреА рд╣реИ, рд▓реЗрдХрд┐рди рдЕрдЧрд░ рдЖрдк рдПрдХ рдШрдВрдЯреЗ рдкреИрджрд▓ рдЪрд▓рдХрд░ рд░рд╣рддреЗ рд╣реИрдВ
рдирд┐рдХрдЯрддрдо рдореЗрдЯреНрд░реЛ рд╕реЗ - рдЗрд╕рдХрд╛ рдХреЛрдИ рдорддрд▓рдм рдирд╣реАрдВ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред
рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рджреЗрдЦрддреЗ рд╣реИрдВ - рдпрд╣ рдХрдИ рдХрд╛рд░рдХреЛрдВ рдФрд░ рджреГрд╖реНрдЯрд┐рдХреЛрдгреЛрдВ рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддрд╛ рд╣реИред рдФрд░ рд╣рдорд╛рд░реЗ рдЬрд┐рдпреЛрдбреЗрдЯрд╛ рдХреА рдкреНрд░рдХреГрддрд┐ рд░реИрдЦрд┐рдХ рдирд╣реАрдВ рд╣реИ, рд╣рдо рдЙрдирдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЛ рдЕрддрд┐рд░рд┐рдХреНрдд рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдЗрд╕реА рд╕рдордп, рд╡рд┐рдЪрд┐рддреНрд░ рдЧреБрдгрд╛рдВрдХ рд╡рд╛рд▓реЗ рдореЙрдбрд▓ рдкрд┐рдЫрд▓реЗ рдПрдХ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмреЗрд╣рддрд░ рдХреНрдпреЛрдВ рдХрд╛рдо рдХрд░рддреЗ рд╣реИрдВ?
plot.figure(figsize=(10,10)) corr = df.corr()*100.0 sns.heatmap(corr[['cost']], cmap= sns.diverging_palette(220, 10), center=0, linewidths=1, cbar_kws={"shrink": .7}, annot=True, fmt=".2f")я╗┐я╗┐я╗┐я╗┐

рдпрд╣ рджрд┐рд▓рдЪрд╕реНрдк рд▓рдЧ рд░рд╣рд╛ рд╣реИред рд╣рдордиреЗ рдкрд┐рдЫрд▓реЗ рднрд╛рдЧ рдореЗрдВ рдЗрд╕реА рддрд░рд╣ рдХреА рддрд╕реНрд╡реАрд░ рджреЗрдЦреА рд╣реИред
рдирд┐рдХрдЯрддрдо рдореЗрдЯреНрд░реЛ рдФрд░ рдХреАрдордд рдХреЗ рдмреАрдЪ рдХреА рджреВрд░реА рдХреЗ рдмреАрдЪ рдПрдХ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз рд╣реИред рдФрд░ рдЗрд╕ рдХрд╛рд░рдХ рдХрд╛ рдХреБрдЫ рдкреБрд░рд╛рдиреЗ рд▓реЛрдЧреЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рд╕рдЯреАрдХрддрд╛ рдкрд░ рдкреНрд░рднрд╛рд╡ рдкрдбрд╝рддрд╛ рд╣реИред
рдЗрд╕ рдмреАрдЪ , рд╣рдорд╛рд░рд╛ рдореЙрдбрд▓ рдЧрдбрд╝рдмрдбрд╝ рд╣реИ рдФрд░ рдПрдХрддреНрд░рд┐рдд рдбреЗрдЯрд╛ рдФрд░ рд▓рдХреНрд╖реНрдп рдЪрд░ рдХреЗ рдмреАрдЪ рдирд┐рд░реНрднрд░рддрд╛ рдирд╣реАрдВ рджреЗрдЦрддрд╛ рд╣реИред рд░реИрдЦрд┐рдХ рдкреНрд░рддрд┐рдЧрдорди рдХреА рд╕рд╛рджрдЧреА рдХреА рдЕрдкрдиреА рд╕реАрдорд╛рдПрдВ рд╣реИрдВред
рд░рд╛рдЬрд╛ рдорд░ рдЪреБрдХрд╛ рд╣реИ, рд▓рдВрдмреЗ рд╕рдордп рддрдХ рд░рд╛рдЬрд╛ рд░рд╣реЛ!
рдФрд░ рдЕрдЧрд░ рдПрдХ рд░реИрдЦрд┐рдХ рдкреНрд░рддрд┐рдЧрдорди рд╣рдорд╛рд░реЗ рдорд╛рдорд▓реЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рдирд╣реАрдВ рд╣реИ, рддреЛ рдХреНрдпрд╛ рдмреЗрд╣рддрд░ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ? рдпрджрд┐ рдХреЗрд╡рд▓ рд╣рдорд╛рд░рд╛ рдореЙрдбрд▓ "рд╣реЛрд╢рд┐рдпрд╛рд░" рд╣реЛ рд╕рдХрддрд╛ рд╣реИ ...
рд╕реМрднрд╛рдЧреНрдп рд╕реЗ, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдХ рджреГрд╖реНрдЯрд┐рдХреЛрдг рд╣реИ рдЬреЛ рдЗрд╕рдХреЗ рдХрд╛рд░рдг рдмреЗрд╣рддрд░ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП ... рд▓рдЪреАрд▓рд╛ рдФрд░ рдПрдХ рдЕрдВрддрд░реНрдирд┐рд╣рд┐рдд рддрдВрддреНрд░ рд╣реИ "рдпрджрд┐ рдРрд╕рд╛ рд╣реИ рддреЛ рдРрд╕рд╛ рдХрд░реЗрдВ"ред
рдирд┐рд░реНрдгрдп рд╡реГрдХреНрд╖ рджреГрд╢реНрдп рдкрд░ рджрд┐рдЦрд╛рдИ рджреЗрддрд╛ рд╣реИред
from sklearn.tree import DecisionTreeRegressor A decision tree can have a different depth, usually, it works well when depth is 3 and bigger. And the parameter of max depth has the biggest influence on the result. Let's do some code for checking depth from 3 to 32 data = [] for x in range(3,32): regressor = DecisionTreeRegressor(max_depth=x,random_state=42) model = regressor.fit(X_train, y_train) accuracy = do_cross_validation(X, y, model) data.append({'max_depth':x,'accuracy':accuracy}) data = pd.DataFrame(data) ax = sns.lineplot(x="max_depth", y="accuracy", data=data) max_result = data.loc[data['accuracy'].idxmax()] ax.set_title(f'Max accuracy-{max_result.accuracy}\nDepth {max_result.max_depth} ')

рдЦреИрд░ ... рдПрдХ рд╕реНрдерд┐рддрд┐ рдХреЗ рд▓рд┐рдП рдЬрдм рдПрдо рдПрдХ рдкреЗрдбрд╝ рдХрд╛ Ax_depth 8 рдХреЗ рдмрд░рд╛рдмрд░ рд╣реИ рдЬрд┐рд╕рдХреА рд╕рдЯреАрдХрддрд╛ 77 рд╕реЗ рдКрдкрд░ рд╣реИред
рдФрд░ рдпрд╣ рдПрдХ рдЕрдЪреНрдЫреА рдЙрдкрд▓рдмреНрдзрд┐ рд╣реЛрдЧреА рдЕрдЧрд░ рд╣рдордиреЗ рдЙрд╕ рджреГрд╖реНрдЯрд┐рдХреЛрдг рдХреА рд╕реАрдорд╛рдУрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд╣реАрдВ рд╕реЛрдЪрд╛ред рдпрд╣ рдХреИрд╕реЗ рдХрд╛рдо рдХрд░реЗрдЧрд╛, рдЗрд╕ рдкрд░ рдПрдХ рдирдЬрд░ рдбрд╛рд▓рддреЗ рд╣реИрдВ M ax_depht = 2
from IPython.core.display import Image, SVG from sklearn.tree import export_graphviz from graphviz import Source 2_level_regressor = DecisionTreeRegressor(max_depth=2, random_state=42) model = 2_level_regressor.fit(X_train, y_train) graph = Source(export_graphviz(model, out_file=None , feature_names=X.columns , filled = True)) SVG(graph.pipe(format='svg'))

рдЗрд╕ рддрд╕реНрд╡реАрд░ рдкрд░, рд╣рдо рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреЗ рдХреЗрд╡рд▓ 4 рд╕рдВрд╕реНрдХрд░рдг рд╣реИрдВред рдЬрдм рдЖрдк DecisionTreeRegressor рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдпрд╣ рд░реИрдЦрд┐рдХ рдкреНрд░рддрд┐рдЧрдорди рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрд▓рдЧ рддрд░рд╣ рд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рдмрд╕ рдЕрд▓рдЧ рддрд░рд╣ рд╕реЗред рдпрд╣ рдХрд╛рд░рдХреЛрдВ (рдЧреБрдгрд╛рдВрдХ) рдХреЗ рдпреЛрдЧрджрд╛рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИ, рдЗрд╕рдХреЗ рдмрдЬрд╛рдп DecisionTreeRegressor "рд╕рдВрднрд╛рд╡рдирд╛" рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред рдФрд░ рдПрдХ рдлреНрд▓реИрдЯ рдХреА рдХреАрдордд рднреА рд╡реИрд╕реА рд╣реА рд╣реЛрдЧреА, рдЬреИрд╕рд╛ рдХрд┐ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рдирд┐рдд рдлреНрд▓реИрдЯ рдХреЗ рд╕рдорд╛рди рд╣реИред
рд╣рдо рдЙрд╕ рдкреЗрдбрд╝ рдХреЗ рд╕рд╛рде рдЕрдкрдиреА рдХреАрдордд рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдХрд░ рджрд┐рдЦрд╛ рд╕рдХрддреЗ рд╣реИрдВред
y = two_level_regressor.predict(X_test) errors = pd.DataFrame(data=y,columns=['errors']) f, ax = plot.subplots(figsize=(12, 12)) sns.countplot(x="errors", data=errors)

рдФрд░ рдЖрдкрдХреА рд╣рд░ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдЗрдирдореЗрдВ рд╕реЗ рдХрд┐рд╕реА рдПрдХ рдореВрд▓реНрдп рдХреЗ рд╕рд╛рде рдореЗрд▓ рдЦрд╛рдПрдЧреАред рдФрд░ рдЬрдм рд╣рдо max_depth = 8 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рддреЛ рд╣рдо 2000 рд╕реЗ рдЕрдзрд┐рдХ рдлреНрд▓реИрдЯреЛрдВ рдХреЗ рд▓рд┐рдП 256 рд╕реЗ рдЕрдзрд┐рдХ рд╡рд┐рднрд┐рдиреНрди рд╡рд┐рдХрд▓реНрдкреЛрдВ рдХреА рдЕрдкреЗрдХреНрд╖рд╛ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рд╢рд╛рдпрдж рдпрд╣ рд╡рд░реНрдЧреАрдХрд░рдг рдХреЗ рдореБрджреНрджреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрдЪреНрдЫрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рд╣рдорд╛рд░реЗ рдорд╛рдорд▓реЗ рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╛рдкреНрдд рд▓рдЪреАрд▓рд╛ рдирд╣реАрдВ рд╣реИред
рднреАрдбрд╝ рдХреА рдмреБрджреНрдзрд┐
рдпрджрд┐ рдЖрдк рд╡рд┐рд╢реНрд╡ рдХрдк рдХреЗ рдлрд╛рдЗрдирд▓ рдкрд░ рд╕реНрдХреЛрд░ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддреЗ рд╣реИрдВ - рдПрдХ рдмрдбрд╝реА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ рдХрд┐ рдЖрдкрд╕реЗ рдЧрд▓рддреА рд╣реЛрдЧреАред рдЙрд╕реА рд╕рдордп, рдпрджрд┐ рдЖрдк рдЪреИрдореНрдкрд┐рдпрдирд╢рд┐рдк рдкрд░ рд╕рднреА рдиреНрдпрд╛рдпрд╛рдзреАрд╢реЛрдВ рд╕реЗ рд░рд╛рдп рдорд╛рдВрдЧрддреЗ рд╣реИрдВ - рддреЛ рдЖрдкрдХреЗ рдкрд╛рд╕ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдмреЗрд╣рддрд░ рдЕрд╡рд╕рд░ рд╣реЛрдВрдЧреЗред рдпрджрд┐ рдЖрдк рд╕реНрд╡рддрдВрддреНрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮреЛрдВ, рдкреНрд░рд╢рд┐рдХреНрд╖рдХреЛрдВ, рдиреНрдпрд╛рдпрд╛рдзреАрд╢реЛрдВ рд╕реЗ рдкреВрдЫрддреЗ рд╣реИрдВ рдФрд░ рдлрд┐рд░ рдЬрд╡рд╛рдм рдХреЗ рд╕рд╛рде рдХреБрдЫ рдЬрд╛рджреВ рдХрд░рддреЗ рд╣реИрдВ - рддреЛ рдЖрдкрдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХрд╛рдлреА рдмрдврд╝ рдЬрд╛рдПрдЧреАред рд░рд╛рд╖реНрдЯреНрд░рдкрддрд┐ рдХреЗ рдЪреБрдирд╛рд╡ рдЬреИрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИред
рдХрдИ "рдЖрджрд┐рдо" рдкреЗрдбрд╝реЛрдВ рдХрд╛ рдкрд╣рдирд╛рд╡рд╛ рдЙрдирдореЗрдВ рд╕реЗ рдкреНрд░рддреНрдпреЗрдХ рд╕реЗ рдЕрдзрд┐рдХ рджреЗ рд╕рдХрддрд╛ рд╣реИред рдФрд░ рд░рд╛рдВрдбреЛ mForestRegressor рд╣реИ рдПрдХ рдЙрдкрдХрд░рдг рдЬреЛ рд╣рдо рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВрдЧреЗ
рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рдЖрдЗрдП рдмреБрдирд┐рдпрд╛рджреА рдкрд░рдорд╛рдирдВрджреЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВ - рдореЙрдбрд▓ рдореЗрдВ max_depth , max_features рдФрд░ рдкреЗрдбрд╝реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ ред
рдкреЗрдбрд╝реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛
"рдХрд┐рддрдиреЗ рдкреЗрдбрд╝ рдПрдХ рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рд╡рди рдореЗрдВ?" рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рд╡рд┐рдХрд▓реНрдк 128 рдкреЗрдбрд╝ рд╣реЛрдВрдЧреЗ ред рдкреЗрдбрд╝реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рдФрд░ рд╡реГрджреНрдзрд┐ рд╕реЗ рд╕рдЯреАрдХрддрд╛ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕реБрдзрд╛рд░ рдирд╣реАрдВ рд╣реЛрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рд╕рдордп рдмрдврд╝рддрд╛ рд╣реИред
рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХреА рдЕрдзрд┐рдХрддрдо рд╕рдВрдЦреНрдпрд╛
рдЕрднреА рд╣рдорд╛рд░реЗ рдореЙрдбрд▓ рдореЗрдВ 12 рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рд╣реИрдВред рдЙрдирдореЗрдВ рд╕реЗ рдЖрдзреЗ рдкреБрд░рд╛рдиреЗ рд╣реИрдВ рдЬреЛ рдХрд┐ рдлреНрд▓реИрдЯ рдХреА рд╕реБрд╡рд┐рдзрд╛рдУрдВ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВ, рдЕрдиреНрдп рднреВ-рд╕рдВрджрд░реНрдн рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред рдЗрд╕рд▓рд┐рдП рдореИрдВрдиреЗ рдЙрдирдореЗрдВ рд╕реЗ рдкреНрд░рддреНрдпреЗрдХ рдХреЗ рд▓рд┐рдП рдПрдХ рдореМрдХрд╛ рджреЗрдиреЗ рдХрд╛ рдлреИрд╕рд▓рд╛ рдХрд┐рдпрд╛ред рдЗрд╕реЗ рдПрдХ рдкреЗрдбрд╝ рдХреЗ рд▓рд┐рдП 6 рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рд╣реЛрдиреЗ рджреЗрдВред
рдПрдХ рдкреЗрдбрд╝ рдХреА рдЕрдзрд┐рдХрддрдо рдЧрд╣рд░рд╛рдИ
рдЙрд╕ рдкреИрд░рд╛рдореАрдЯрд░ рдХреЗ рд▓рд┐рдП, рд╣рдо рдПрдХ рд╕реАрдЦрдиреЗ рдХреА рдЕрд╡рд╕реНрдерд╛ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
from sklearn.ensemble import RandomForestRegressor data = [] for x in range(1,32): regressor = RandomForestRegressor(random_state=42, max_depth=x, n_estimators=128,max_features=6)я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐model = regressor.fit(X_train, y_train)я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐accuracy = do_cross_validation(X, y, model) data.append({'max_depth':x,'accuracy':accuracy}) data = pd.DataFrame(data) f, ax = plot.subplots(figsize=(10, 10)) sns.lineplot(x="max_depth", y="accuracy", data=data) max_result = data.loc[data['accuracy'].idxmax()] ax.set_title(f'Max accuracy-{max_result.accuracy}\nDepth {max_result.max_depth} ')
from sklearn.ensemble import RandomForestRegressor data = [] for x in range(1,32): regressor = RandomForestRegressor(random_state=42, max_depth=x, n_estimators=128,max_features=6)я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐model = regressor.fit(X_train, y_train)я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐accuracy = do_cross_validation(X, y, model) data.append({'max_depth':x,'accuracy':accuracy}) data = pd.DataFrame(data) f, ax = plot.subplots(figsize=(10, 10)) sns.lineplot(x="max_depth", y="accuracy", data=data) max_result = data.loc[data['accuracy'].idxmax()] ax.set_title(f'Max accuracy-{max_result.accuracy}\nDepth {max_result.max_depth} ')
from sklearn.ensemble import RandomForestRegressor data = [] for x in range(1,32): regressor = RandomForestRegressor(random_state=42, max_depth=x, n_estimators=128,max_features=6)я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐model = regressor.fit(X_train, y_train)я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐я╗┐accuracy = do_cross_validation(X, y, model) data.append({'max_depth':x,'accuracy':accuracy}) data = pd.DataFrame(data) f, ax = plot.subplots(figsize=(10, 10)) sns.lineplot(x="max_depth", y="accuracy", data=data) max_result = data.loc[data['accuracy'].idxmax()] ax.set_title(f'Max accuracy-{max_result.accuracy}\nDepth {max_result.max_depth} ')

рд╡рд╛рд╣ ... 86% рд╕реЗ рдЕрдзрд┐рдХ рд╕рдЯреАрдХрддрд╛ рдкрд░ рдПрдХ рдбрд┐рдЬрд╛рдЗрди рдкреЗрдбрд╝ рдкрд░ max_depth = 16 рдХреЗ рдЦрд┐рд▓рд╛рдл 77%ред рдпрд╣ рдЖрд╢реНрдЪрд░реНрдпрдЬрдирдХ рд▓рдЧ рд░рд╣рд╛ рд╣реИ, рд╣реИ рдирд╛?
рдирд┐рд╖реНрдХрд░реНрд╖
рдЦреИрд░ ... рдЕрдм рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдкрд┐рдЫрд▓реЗ рд╡рд╛рд▓реЗ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмреЗрд╣рддрд░ рдкрд░рд┐рдгрд╛рдо рд╣реИ, 86% рдлрд┐рдирд┐рд╢ рд▓рд╛рдЗрди рдХреЗ рдкрд╛рд╕ рд╣реИред рдЬрд╛рдБрдЪ рдХреЗ рд▓рд┐рдП рдЕрдВрддрд┐рдо рдЪрд░рдг - рдлреАрдЪрд░ рдорд╣рддреНрд╡ рдХреЛ рджреЗрдЦрддреЗ рд╣реИрдВред рдХреНрдпрд╛ рдЬрд┐рдпреЛрдбреЗрдЯрд╛ рдиреЗ рд╣рдорд╛рд░реЗ рдореЙрдбрд▓ рдХреЛ рдХреЛрдИ рд▓рд╛рдн рджрд┐рдпрд╛ рд╣реИ?
feat_importances = model.feature_importances_ feat_importances = pd.Series(feat_importances, index=X.columns) feat_importances.nlargest(5).plot(kind='barh')

рдХреБрдЫ рдкреБрд░рд╛рдиреА рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдВ рдЕрднреА рднреА рдкрд░рд┐рдгрд╛рдо рдкрд░ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реБрдИ рд╣реИрдВред рд╕рд╛рде рд╣реА рдирд┐рдХрдЯрддрдо рдореЗрдЯреНрд░реЛ рдФрд░ рдХрд┐рдВрдбрд░рдЧрд╛рд░реНрдЯрди рдХреА рджреВрд░реА рднреА рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реБрдИ рд╣реИред рдФрд░ рдпрд╣ рддрд░реНрдХрд╕рдВрдЧрдд рд▓рдЧрддрд╛ рд╣реИред
рдмрд┐рдирд╛ рдХрд┐рд╕реА рд╕рдВрджреЗрд╣ рдХреЗ, рдЬрд┐рдпреЛрдбреЗрдЯрд╛ рдиреЗ рд╣рдореЗрдВ рдЕрдкрдиреЗ рдореЙрдбрд▓ рдХреЛ рдмреЗрд╣рддрд░ рдмрдирд╛рдиреЗ рдореЗрдВ рдорджрдж рдХреАред
рдкрдврд╝рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж!
рдкреБрдирд╢реНрдЪ
рд╣рдорд╛рд░реА рдпрд╛рддреНрд░рд╛ рдЕрднреА рд╕рдорд╛рдкреНрдд рдирд╣реАрдВ рд╣реБрдИ рд╣реИред 86% рд╕рдЯреАрдХрддрд╛ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдПрдХ рдЬрдмрд░рджрд╕реНрдд рдкрд░рд┐рдгрд╛рдо рд╣реИред рдЗрд╕ рдмреАрдЪ, 14% рдФрд░ 10% рдФрд╕рдд рддреНрд░реБрдЯрд┐ рдХреЗ рдмреАрдЪ рдПрдХ рдЫреЛрдЯреА рдЦрд╛рдИ рд╣реИ, рдЬрд┐рд╕рдХреА рд╣рдо рдЙрдореНрдореАрдж рдХрд░рддреЗ рд╣реИрдВред рд╣рдорд╛рд░реА рдХрд╣рд╛рдиреА рдХреЗ рдЕрдЧрд▓реЗ рдЕрдзреНрдпрд╛рдп рдореЗрдВ, рд╣рдо рдЗрд╕ рдмрд╛рдзрд╛ рдХреЛ рджреВрд░ рдХрд░рдиреЗ рдпрд╛ рдХрдо рд╕реЗ рдХрдо рдЗрд╕ рддреНрд░реБрдЯрд┐ рдХреЛ рдХрдо рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВрдЧреЗред
рдЖрдИрдкреАрдереЙрди-рдиреЛрдЯрдмреБрдХ рд╣реИ