рдпрджрд┐ рдЖрдкрдиреЗ рд╣рд╛рд▓ рд╣реА рдореЗрдВ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдореЗрдВ рдЕрдкрдиреА рдпрд╛рддреНрд░рд╛ рд╢реБрд░реВ рдХреА рд╣реИ, рддреЛ рдЖрдк LabelEncoder рдФрд░ OneHotEncoder рдХреЗ рдмреАрдЪ рдЙрд▓рдЭ рд╕рдХрддреЗ рд╣реИрдВред рджреЛрдиреЛрдВ рдПрдиреНрдХреЛрдбрд░ рдкрд╛рдпрдерди рдореЗрдВ SciKit Learn Library рдХрд╛ рд╣рд┐рд╕реНрд╕рд╛ рд╣реИрдВ рдФрд░ рджреЛрдиреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдпрд╛ рдкрд╛рдареНрдп рдбреЗрдЯрд╛ рдХреЛ рдЙрди рд╕рдВрдЦреНрдпрд╛рдУрдВ рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдЬрд┐рдиреНрд╣реЗрдВ рд╣рдорд╛рд░реЗ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдореЙрдбрд▓ рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рд╕рдордЭрддреЗ рд╣реИрдВред рдЖрдЗрдП рд╕рд░рд▓ рдЙрджрд╛рд╣рд░рдг рдкрд░ рдПрдирдХреЛрдбрд░ рдХреЗ рдмреАрдЪ рдХреЗ рдЕрдВрддрд░ рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдПрдВред
рдЪрд░рд┐рддреНрд░ рдПрдиреНрдХреЛрдбрд┐рдВрдЧ
рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рд▓реЗрдмрд▓ рдХреЗ рд▓рд┐рдП SciKit рд▓рд░реНрди рдбреЙрдХреНрдпреВрдореЗрдВрдЯреЗрд╢рди рдпрд╣рд╛рдВ рдкрд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ ред рдЕрдм рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЖрдВрдХрдбрд╝реЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВ:
SuperDataScience рд╕реЗ рдбреЗрдЯрд╛рдЗрд╕ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рдкрд╣рд▓рд╛ рдХреЙрд▓рдо (рджреЗрд╢) рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдЯреЗрдХреНрд╕реНрдЯ рд╣реИред рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдЬрд╛рдирддреЗ рд╣реИрдВ, рд╣рдо рдореЙрдбрд▓ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдбреЗрдЯрд╛ рдореЗрдВ рдкрд╛рда рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдЗрд╕рд▓рд┐рдП, рдЗрд╕рд╕реЗ рдкрд╣рд▓реЗ рдХрд┐ рд╣рдо рдкреНрд░рдХреНрд░рд┐рдпрд╛ рд╢реБрд░реВ рдХрд░ рд╕рдХреЗрдВ, рд╣рдореЗрдВ рдпрд╣ рдбреЗрдЯрд╛ рддреИрдпрд╛рд░ рдХрд░рдирд╛ рд╣реЛрдЧрд╛ред
рдФрд░ рдРрд╕реА рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЛ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдбреЗрдЯрд╛ рдХреЗ рд╕рдордЭрдиреЗ рдпреЛрдЧреНрдп рдореЙрдбрд▓ рдореЗрдВ рдмрджрд▓рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо LabelEncoder рд╡рд░реНрдЧ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕ рдкреНрд░рдХрд╛рд░, рд╣рдо рд╕рднреА рдХреЛ рдкрд╣рд▓реЗ рдХреЙрд▓рдо рдХреЗ рд▓рд┐рдП рд╡рд┐рд╢реЗрд╖рддрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ, рд╡рд░реНрдЧ рдХреЛ рд╕реНрдХреЗрд▓реЗрд░ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рд╕реЗ рдЖрдпрд╛рдд рдХрд░рдирд╛ рд╣реИ, рдХреЙрд▓рдо рдХреЛ fit_transform рдлрд╝рдВрдХреНрд╢рди рдХреЗ рд╕рд╛рде рд╕рдВрд╕рд╛рдзрд┐рдд рдХрд░реЗрдВ , рдФрд░ рдореМрдЬреВрджрд╛ рдкрд╛рда рдбреЗрдЯрд╛ рдХреЛ рдирдП рдПрдиреНрдХреЛрдбреЗрдб рдХреЗ рд╕рд╛рде рдмрджрд▓реЗрдВред рдХреЛрдб рдХреЛ рджреЗрдЦрддреЗ рд╣реИрдВред
from sklearn.preprocessing import LabelEncoder labelencoder = LabelEncoder() x[:, 0] = labelencoder.fit_transform(x[:, 0])
рдпрд╣ рдорд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдЪрд░ x рдореЗрдВ рд╣реИ ред рдКрдкрд░ рджрд┐рдП рдЧрдП рдХреЛрдб рдХреЛ рдЪрд▓рд╛рдиреЗ рдХреЗ рдмрд╛рдж, рдпрджрд┐ рдЖрдк x рдорд╛рди рдХреА рдЬрд╛рдВрдЪ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдЖрдк рджреЗрдЦреЗрдВрдЧреЗ рдХрд┐ рдкрд╣рд▓реЗ рдХреЙрд▓рдо рдореЗрдВ рддреАрди рджреЗрд╢реЛрдВ рдХреЛ 0, 1 рдФрд░ 2 рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рдмрджрд▓ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рд╕рд╛рдорд╛рдиреНрдп рддреМрд░ рдкрд░, рдпрд╣ рд╕рдВрдХреЗрддреЛрдВ рдХреА рдХреЛрдбрд┐рдВрдЧ рд╣реИред рд▓реЗрдХрд┐рди рдЖрдВрдХрдбрд╝реЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░, рдпрд╣ рд░реВрдкрд╛рдВрддрд░рдг рдПрдХ рдирдИ рд╕рдорд╕реНрдпрд╛ рдкреИрджрд╛ рдХрд░рддрд╛ рд╣реИред рд╣рдордиреЗ рджреЗрд╢реЛрдВ рдХреЗ рдПрдХ рд╕рдореВрд╣ рдХреЛ рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХреЗ рд╕рдореВрд╣ рдореЗрдВ рдмрджрд▓ рджрд┐рдпрд╛ рд╣реИред рд▓реЗрдХрд┐рди рдпрд╣ рд╕рд┐рд░реНрдл рд╢реНрд░реЗрдгреАрдмрджреНрдз рдбреЗрдЯрд╛ рд╣реИ, рдФрд░ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ рд╣реИред
рдпрд╣рд╛рдВ рд╕рдорд╕реНрдпрд╛ рдпрд╣ рд╣реИ рдХрд┐, рдЪреВрдВрдХрд┐ рдПрдХ рд╣реА рдХреЙрд▓рдо рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдВрдЦреНрдпрд╛рдПрдБ рд╣реИрдВ, рдЗрд╕рд▓рд┐рдП рдореЙрдбрд▓ рдЧрд▓рдд рддрд░реАрдХреЗ рд╕реЗ рд╕реЛрдЪреЗрдВрдЧреЗ рдХрд┐ рдбреЗрдЯрд╛ рдХреБрдЫ рд╡рд┐рд╢реЗрд╖ рдХреНрд░рдо рдореЗрдВ рд╣реИ - 0 <1 <2 рд╣рд╛рд▓рд╛рдВрдХрд┐ рдпрд╣, рдЬрд╝рд╛рд╣рд┐рд░ рд╣реИ, рдРрд╕рд╛ рдмрд┐рд▓реНрдХреБрд▓ рднреА рдирд╣реАрдВ рд╣реИред рд╕рдорд╕реНрдпрд╛ рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо OneHotEncoder рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ ред
OneHotEncoder
рдпрджрд┐ рдЖрдк рджрд╕реНрддрд╛рд╡реЗрдЬрд╝ рдкрдврд╝рдиреЗ рдореЗрдВ рд░реБрдЪрд┐ рд░рдЦрддреЗ рд╣реИрдВ, рддреЛ рдЖрдк рдЗрд╕реЗ рдпрд╣рд╛рдБ рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВред рдЕрдм, рдЬреИрд╕рд╛ рдХрд┐ рд╣рдордиреЗ рдкрд╣рд▓реЗ рд╣реА рдЪрд░реНрдЪрд╛ рдХреА рд╣реИ, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдореМрдЬреВрдж рдбреЗрдЯрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░, рд╣рдо рдРрд╕реА рд╕реНрдерд┐рддрд┐ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬрд╣рд╛рдВ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЛ рдПрдиреНрдХреЛрдбрд┐рдВрдЧ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рд╣рдорд╛рд░рд╛ рдореЙрдбрд▓ рднреНрд░рдорд┐рдд рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рдЧрд▓рдд рддрд░реАрдХреЗ рд╕реЗ рдпрд╣ рдорд╛рди рд▓реЗрддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдПрдХ рдЖрджреЗрд╢ рдпрд╛ рдкрджрд╛рдиреБрдХреНрд░рдо рджреНрд╡рд╛рд░рд╛ рдЬреБрдбрд╝рд╛ рд╣реБрдЖ рд╣реИ рдЬреЛ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдирд╣реАрдВ рд╣реИред рдЗрд╕рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо OneHotEncoder рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВрдЧреЗ ред
рдпрд╣ рдПрдирдХреЛрдбрд░ рдПрдХ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдПрдХ рдХреЙрд▓рдо рд▓реЗрддрд╛ рд╣реИ рдЬреЛ рдкрд╣рд▓реЗ рдПрдХ рд╡рд┐рд╢реЗрд╖рддрд╛ рдореЗрдВ рдПрдиреНрдХреЛрдб рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рдФрд░ рдЗрд╕рдХреЗ рд▓рд┐рдП рдХрдИ рдирдП рдХреЙрд▓рдо рдмрдирд╛рддрд╛ рд╣реИред рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХреЛ рд▓реЛрдЧреЛрдВ рдФрд░ рд╢реВрдиреНрдп рдХреЗ рд╕рд╛рде рдмрджрд▓ рджрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдпрд╣ рдирд┐рд░реНрднрд░ рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдХреМрди рд╕рд╛ рдХреЙрд▓рдо рдЕрдВрддрд░реНрдирд┐рд╣рд┐рдд рд╣реИред рд╣рдорд╛рд░реЗ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдореЗрдВ рддреАрди рдирдП рдХреЙрд▓рдо рдорд┐рд▓реЗ рд╣реИрдВ, рдкреНрд░рддреНрдпреЗрдХ рджреЗрд╢ рдХреЗ рд▓рд┐рдП рдПрдХ - рдлреНрд░рд╛рдВрд╕, рдЬрд░реНрдордиреА рдФрд░ рд╕реНрдкреЗрдиред
рдЙрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд┐рдирдХрд╛ рдкрд╣рд▓рд╛ рдХреЙрд▓рдо рдлреНрд░рд╛рдВрд╕ рд╣реИ, рдХреЙрд▓рдо "рдлреНрд░рд╛рдВрд╕" рдХреЛ "1" рдФрд░ рджреВрд╕рд░реЗ рджреЛ рдХреЙрд▓рдо рдХреЛ "0" рдкрд░ рд╕реЗрдЯ рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред рдЗрд╕реА рддрд░рд╣, рдЙрди рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд┐рдирдХрд╛ рдкрд╣рд▓рд╛ рдХреЙрд▓рдо рдЬрд░реНрдордиреА рд╣реИ, рдЬрд░реНрдордиреА рдХреЙрд▓рдо рдореЗрдВ "1" рдФрд░ рдЕрдиреНрдп рджреЛ рдХреЙрд▓рдо рдореЗрдВ "0" рд╣реЛрдЧрд╛ред
рдпрд╣ рдмрд╣реБрдд рд╕рд░рд▓рддрд╛ рд╕реЗ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
from sklearn.preprocessing import OneHotEncoder onehotencoder = OneHotEncoder(categorical_features = [0]) x = onehotencoder.fit_transform(x).toarray()
рдХрдВрд╕реНрдЯреНрд░рдХреНрдЯрд░ рдореЗрдВ, рд╣рдо рдЗрдВрдЧрд┐рдд рдХрд░рддреЗ рд╣реИрдВ рдХрд┐ рд╣рдорд╛рд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ OneHotEncoder рджреНрд╡рд╛рд░рд╛ рдХрд┐рд╕ рдХреЙрд▓рдо рдХреЛ рд╕рдВрд╕рд╛рдзрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП - [0] ред рдлрд┐рд░ рдЖрдкрдХреЗ рджреНрд╡рд╛рд░рд╛ рдЕрднреА рдмрдирд╛рдП рдЧрдП рдПрдирдХреЛрдбрд░ рдСрдмреНрдЬреЗрдХреНрдЯ рдХреЗ fit_transform рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдПрдХреНрд╕ рд╕рд░рдгреА рдХреЛ рд░реВрдкрд╛рдВрддрд░рд┐рдд рдХрд░реЗрдВ ред рдпрд╣реА рд╣реИ, рдЕрдм рд╣рдо рдбреЗрдЯрд╛рд╕реЗрдЯ рдореЗрдВ рддреАрди рдирдП рдХреЙрд▓рдо рд╣реИрдВ:
рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ, рдПрдХ рджреЗрд╢ рдХреЗ рд╕рд╛рде рдПрдХ рдХреЙрд▓рдо рдХреЗ рдмрдЬрд╛рдп, рд╣рдореЗрдВ рдЗрд╕ рджреЗрд╢ рдХреЛ рдПрдиреНрдХреЛрдбрд┐рдВрдЧ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рддреАрди рдирдП рдорд┐рд▓ рдЧрдПред
рдпрд╣ LabEncoder рдФрд░ OneHotEncoder рд╕реЗ рдЕрдВрддрд░ рд╣реИред