рдореИрдВ рдЖрдкрдХреЛ рдПрдирд╛рдХреЛрдВрдбрд╛ рдХреЗ рд╕рд╛рде рд╣реИрдВрдбреНрд╕-рдСрди рдбреЗрдЯрд╛ рд╕рд╛рдЗрдВрд╕ рдХреА рдкреБрд╕реНрддрдХ рдХреЗ рдПрдХ рдЕрдзреНрдпрд╛рдп рдХрд╛ рдЕрдиреБрд╡рд╛рдж рдкреНрд░рд╕реНрддреБрдд рдХрд░рддрд╛ рд╣реВрдВ
"рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг - рдореЙрдбрд▓рд┐рдВрдЧ рдФрд░ рд╕рддреНрдпрд╛рдкрди"
рд╡рд┐рднрд┐рдиреНрди рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдореЗрдВ рд╣рдорд╛рд░рд╛ рдореБрдЦреНрдп рд▓рдХреНрд╖реНрдп рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдХреНрдпрд╛ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ, рдЗрд╕рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреИрдЯрд░реНрди рдХреА рдЦреЛрдЬ рдХрд░рдирд╛ рд╣реИред рд╢реЗрдпрд░ рдмрд╛рдЬрд╛рд░ рдХреЗ рд▓рд┐рдП, рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдФрд░ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮреЛрдВ рдиреЗ рдмрд╛рдЬрд╛рд░ рддрдВрддреНрд░ рдХреЛ рд╕рдордЭрдиреЗ рдХреЗ рд▓рд┐рдП рд╡рд┐рднрд┐рдиреНрди рдкрд░реАрдХреНрд╖рдг рдХрд┐рдПред рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ, рдЖрдк рдмрд╣реБрдд рд╕рд╛рд░реЗ рд╕рд╡рд╛рд▓ рдкреВрдЫ рд╕рдХрддреЗ рд╣реИрдВред рдЕрдЧрд▓реЗ рдкрд╛рдВрдЪ рд╡рд░реНрд╖реЛрдВ рдореЗрдВ рдмрд╛рдЬрд╛рд░ рд╕реВрдЪрдХрд╛рдВрдХ рдХрд╛ рд╕реНрддрд░ рдХреНрдпрд╛ рд╣реЛрдЧрд╛? рдЖрдИрдмреАрдПрдо рдХреЗ рд▓рд┐рдП рдЕрдЧрд▓реА рдореВрд▓реНрдп рд╕реАрдорд╛ рдХреНрдпрд╛ рд╣реЛрдЧреА? рдХреНрдпрд╛ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдмрд╛рдЬрд╛рд░ рдореЗрдВ рдЙрддрд╛рд░-рдЪрдврд╝рд╛рд╡ рдмрдврд╝реЗрдЧрд╛ рдпрд╛ рдШрдЯреЗрдЧрд╛? рдЕрдЧрд░ рд╕рд░рдХрд╛рд░реЗрдВ рдЕрдкрдиреА рдХрд░ рдиреАрддрд┐рдпреЛрдВ рдореЗрдВ рдмрджрд▓рд╛рд╡ рдХрд░рддреА рд╣реИрдВ рддреЛ рдЗрд╕рдХрд╛ рдХреНрдпрд╛ рдкреНрд░рднрд╛рд╡ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ? рдпрджрд┐ рдПрдХ рджреЗрд╢ рджреВрд╕рд░реЗ рдХреЗ рд╕рд╛рде рд╡реНрдпрд╛рдкрд╛рд░ рдпреБрджреНрдз рд╢реБрд░реВ рдХрд░рддрд╛ рд╣реИ рддреЛ рд╕рдВрднрд╛рд╡рд┐рдд рд▓рд╛рдн рдФрд░ рд╣рд╛рдирд┐ рдХреНрдпрд╛ рд╣реИрдВ? рдХреБрдЫ рд╕рдВрдмрдВрдзрд┐рдд рдЪрд░ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдХреЗ рд╣рдо рдЙрдкрднреЛрдХреНрддрд╛ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХреИрд╕реЗ рдХрд░рддреЗ рд╣реИрдВ? рдХреНрдпрд╛ рд╣рдо рдЗрд╕ рд╕рдВрднрд╛рд╡рдирд╛ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдХрд┐ рд╕реНрдирд╛рддрдХ рдЫрд╛рддреНрд░ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рд╕реНрдирд╛рддрдХ рд╣реЛрдЧрд╛? рдХреНрдпрд╛ рд╣рдо рдПрдХ рд╡рд┐рд╢реЗрд╖ рдмреАрдорд╛рд░реА рдХреЗ рд╡рд┐рд╢рд┐рд╖реНрдЯ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЗ рдмреАрдЪ рдПрдХ рд╕рдВрдмрдВрдз рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВ?
рдЗрд╕рд▓рд┐рдП, рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВрдЧреЗ:
- рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЛ рд╕рдордЭрдирд╛
- рдЙрдкрдпреЛрдЧреА рдбреЗрдЯрд╛рд╕реЗрдЯ
- рднрд╡рд┐рд╖реНрдп рдХреА рдШрдЯрдирд╛рдУрдВ рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди
- рдореЙрдбрд▓ рдЪрдпрди
- рдЧреНрд░реЗрдВрдЬрд░ рдХреЙрдЬреЗрд▓рд┐рдЯреА рдЯреЗрд╕реНрдЯ
рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЛ рд╕рдордЭрдирд╛
рд▓реЛрдЧреЛрдВ рдХреЛ рднрд╡рд┐рд╖реНрдп рдХреА рдШрдЯрдирд╛рдУрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХрдИ рд╕рд╡рд╛рд▓ рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВред
- рдПрдХ рдирд┐рд╡реЗрд╢рдХ, рдЕрдЧрд░ рд╡рд╣ рд╕реНрдЯреЙрдХ рдХреА рдХреАрдорддреЛрдВ рдХреЗ рднрд╡рд┐рд╖реНрдп рдХреЗ рдЖрдВрджреЛрд▓рди рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░ рд╕рдХрддрд╛ рд╣реИ, рддреЛ рд╡рд╣ рдПрдХ рдмрдбрд╝рд╛ рд▓рд╛рдн рдХрдорд╛ рд╕рдХрддрд╛ рд╣реИред
- рдХрдВрдкрдирд┐рдпрд╛рдВ, рдпрджрд┐ рд╡реЗ рдЕрдкрдиреЗ рдЙрддреНрдкрд╛рджреЛрдВ рдХреА рдкреНрд░рд╡реГрддреНрддрд┐ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░ рд╕рдХрддреА рд╣реИрдВ, рддреЛ рд╡реЗ рдЕрдкрдиреЗ рд╢реЗрдпрд░ рдХреА рдХреАрдордд рдФрд░ рдмрд╛рдЬрд╛рд░ рдореЗрдВ рд╣рд┐рд╕реНрд╕реЗрджрд╛рд░реА рдмрдврд╝рд╛ рд╕рдХрддреА рд╣реИрдВред
- рд╕рд░рдХрд╛рд░реЗрдВ, рдпрджрд┐ рд╡реЗ рд╕рдорд╛рдЬ рдФрд░ рдЕрд░реНрдерд╡реНрдпрд╡рд╕реНрдерд╛ рдкрд░ рдПрдХ рдмрдврд╝рддреА рдЖрдмрд╛рджреА рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░ рд╕рдХрддреА рд╣реИрдВ, рддреЛ рд░рд╛рдЬреНрдп рдмрдЬрдЯ рдФрд░ рдЕрдиреНрдп рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рд░рдгрдиреАрддрд┐рдХ рдирд┐рд░реНрдгрдпреЛрдВ рдХреЗ рд╕рдВрджрд░реНрдн рдореЗрдВ рдмреЗрд╣рддрд░ рдиреАрддрд┐рдпреЛрдВ рдХреЛ рд╡рд┐рдХрд╕рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдирдХреЗ рдкрд╛рд╕ рдЕрдзрд┐рдХ рдкреНрд░реЛрддреНрд╕рд╛рд╣рди рд╣реЛрдЧрд╛ред
- рд╡рд┐рд╢реНрд╡рд╡рд┐рджреНрдпрд╛рд▓рдпреЛрдВ, рдЕрдЧрд░ рд╡реЗ рдЕрдкрдиреЗ рд╕реНрдирд╛рддрдХреЛрдВ рдХреЗ рд▓рд┐рдП рдЧреБрдгрд╡рддреНрддрд╛ рдФрд░ рдХреМрд╢рд▓ рд╕реЗрдЯ рдХреЗ рдорд╛рдорд▓реЗ рдореЗрдВ рдмрд╛рдЬрд╛рд░ рдХреА рдорд╛рдВрдЧ рдХреЛ рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рд╕рдордЭ рд╕рдХрддреЗ рд╣реИрдВ, рддреЛ рд╡реЗ рднрд╡рд┐рд╖реНрдп рдХреЗ рдХрд╛рд░реНрдпрдмрд▓ рдХреА рдЬрд░реВрд░рддреЛрдВ рдХреЛ рдкреВрд░рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмреЗрд╣рддрд░ рдХрд╛рд░реНрдпрдХреНрд░рдореЛрдВ рдХрд╛ рдПрдХ рд╕реЗрдЯ рд╡рд┐рдХрд╕рд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдпрд╛ рдирдП рдХрд╛рд░реНрдпрдХреНрд░рдо рд▓реЙрдиреНрдЪ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдПрдХ рдмреЗрд╣рддрд░ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХреЗ рд▓рд┐рдП, рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдХреЛ рдХрдИ рд╕рд╡рд╛рд▓реЛрдВ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдирдореВрдирд╛ рдбреЗрдЯрд╛ рдмрд╣реБрдд рдЫреЛрдЯрд╛ рд╣реИ? рд▓рд╛рдкрддрд╛ рдЪрд░ рдХреИрд╕реЗ рдирд┐рдХрд╛рд▓реЗрдВ? рдХреНрдпрд╛ рдпрд╣ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдбреЗрдЯрд╛ рд╕рдВрдЧреНрд░рд╣ рдкреНрд░рдХреНрд░рд┐рдпрд╛рдУрдВ рдХреЗ рд╕рдВрджрд░реНрдн рдореЗрдВ рдкрдХреНрд╖рдкрд╛рддреА рд╣реИ? рд╣рдо рдЪрд░рдо рд╕реАрдорд╛рдУрдВ рдпрд╛ рдЙрддреНрд╕рд░реНрдЬрди рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХреИрд╕рд╛ рдорд╣рд╕реВрд╕ рдХрд░рддреЗ рд╣реИрдВ? рд╕реАрдЬрд╝рдирд╕рд┐рдЯреА рдХреНрдпрд╛ рд╣реИ рдФрд░ рд╣рдо рдЗрд╕рд╕реЗ рдХреИрд╕реЗ рдирд┐рдкрдЯрддреЗ рд╣реИрдВ? рд╣рдореЗрдВ рдХрд┐рди рдореЙрдбрд▓реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдП? рдпрд╣ рдЕрдзреНрдпрд╛рдп рдЗрди рдореБрджреНрджреЛрдВ рдореЗрдВ рд╕реЗ рдХреБрдЫ рдХреЛ рд╕рдВрдмреЛрдзрд┐рдд рдХрд░реЗрдЧрд╛ред рдЪрд▓реЛ рдПрдХ рдЙрдкрдпреЛрдЧреА рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд╕рд╛рде рд╢реБрд░реВ рдХрд░рддреЗ рд╣реИрдВред
рдЙрдкрдпреЛрдЧреА рдбреЗрдЯрд╛рд╕реЗрдЯ
рд╕рдмрд╕реЗ рдЕрдЪреНрдЫреЗ рдбреЗрдЯрд╛ рд╕реНрд░реЛрддреЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ
рдпреВрд╕реАрдЖрдИ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рд░рд┐рдкреЙрдЬрд┐рдЯрд░реА рд╣реИ ред рд╕рд╛рдЗрдЯ рджреЗрдЦрдиреЗ рдХреЗ рдмрд╛рдж рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реВрдЪреА рджреЗрдЦреЗрдВрдЧреЗ:

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдЖрдк рдкрд╣рд▓рд╛ рдбреЗрдЯрд╛рд╕реЗрдЯ (Abalone) рдЪреБрдирддреЗ рд╣реИрдВ, рддреЛ рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рджреЗрдЦреЗрдВрдЧреЗред рд╕реНрдерд╛рди рдмрдЪрд╛рдиреЗ рдХреЗ рд▓рд┐рдП, рдХреЗрд╡рд▓ рд╢реАрд░реНрд╖ рдкреНрд░рджрд░реНрд╢рд┐рдд рд╣реЛрддрд╛ рд╣реИ:

рдпрд╣рд╛рдБ рд╕реЗ, рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдбреЗрдЯрд╛рд╕реЗрдЯ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдкрд░рд┐рд╡рд░реНрддрдирд╢реАрд▓ рдкрд░рд┐рднрд╛рд╖рд╛рдПрдБ рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВред рдбреЗрдЯрд╛рд╕реЗрдЯ рд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдирд┐рдореНрди рдХреЛрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ:
dataSet<-"UCIdatasets" path<-"http://canisius.edu/~yany/RData/" con<-paste(path,dataSet,".RData",sep='') load(url(con)) dim(.UCIdatasets) head(.UCIdatasets)
рдЗрд╕реА рдЖрдЙрдЯрдкреБрдЯ рдХреЛ рдпрд╣рд╛рдБ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ:

рдкрд┐рдЫрд▓реЗ рдирд┐рд╖реНрдХрд░реНрд╖ рд╕реЗ, рд╣рдо рдЬрд╛рдирддреЗ рд╣реИрдВ рдХрд┐ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдореЗрдВ 427 рдЕрд╡рд▓реЛрдХрди (рдбреЗрдЯрд╛ рд╕реЗрдЯ) рд╣реИрдВред рдЙрдирдореЗрдВ рд╕реЗ рдкреНрд░рддреНрдпреЗрдХ рдХреЗ рд▓рд┐рдП, рд╣рдорд╛рд░реЗ 7 рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдп рд╣реИрдВ, рдЬреИрд╕реЗ рдХрд┐
рдирд╛рдо, Data_Types, Default_Task, Attribute_Types, N_Instances (рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛),
N_Attributes (рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреА рд╕рдВрдЦреНрдпрд╛) рдФрд░
рд╡рд░реНрд╖ ред
Default_Task рдирд╛рдордХ рд╡реИрд░рд┐рдПрдмрд▓ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЗ рдореБрдЦреНрдп рдЙрдкрдпреЛрдЧ рдХреЗ рд░реВрдк рдореЗрдВ рдХреА рдЬрд╛ рд╕рдХрддреА рд╣реИред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдЕрдмрд╛рд▓реЛрди рдирд╛рдордХ рдкрд╣рд▓рд╛ рдбреЗрдЯрд╛рд╕реЗрдЯ
рд╡рд░реНрдЧреАрдХрд░рдг рдХреЗ рд▓рд┐рдП рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
рдЕрджреНрд╡рд┐рддреАрдп () рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣рд╛рдВ рджрд┐рдЦрд╛рдП рдЧрдП рд╕рднреА
рдбрд┐рдлрд╝реЙрд▓реНрдЯ Default_Task рдХреЛ рдЦреЛрдЬрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ:

R рдкреИрдХреЗрдЬ AppliedPredictiveModeling
рдЗрд╕ рдкреИрдХреЗрдЬ рдореЗрдВ рдХрдИ рдЙрдкрдпреЛрдЧреА рдбреЗрдЯрд╛рд╕реЗрдЯ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ рдЬрд┐рдирдХрд╛ рдЙрдкрдпреЛрдЧ рдЗрд╕ рдЕрдзреНрдпрд╛рдп рдФрд░ рдЕрдиреНрдп рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдЗрди рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ рдЦреЛрдЬрдиреЗ рдХрд╛ рд╕рдмрд╕реЗ рдЖрд╕рд╛рди рддрд░реАрдХрд╛ рдпрд╣рд╛рдВ рджрд┐рдЦрд╛рдП рдЧрдП
рд╕рд╣рд╛рдпрддрд╛ () рдлрд╝рдВрдХреНрд╢рди рдХреЗ рд╕рд╛рде рд╣реИ:
library(AppliedPredictiveModeling) help(package=AppliedPredictiveModeling)
рдпрд╣рд╛рдВ рд╣рдо рдЗрди рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ рд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рдХреБрдЫ рдЙрджрд╛рд╣рд░рдг рджрд┐рдЦрд╛рддреЗ рд╣реИрдВред рдПрдХ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЛ рд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо
рдбреЗрдЯрд╛ () рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдЕрдмрд╛рд▓реЛрди рдирд╛рдордХ рдкрд╣рд▓реЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд▓рд┐рдП, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рд╣реИрдВ:
library(AppliedPredictiveModeling) data(abalone) dim(abalone) head(abalone)
рдЖрдЙрдЯрдкреБрдЯ рдирд┐рдореНрдирд╛рдиреБрд╕рд╛рд░ рд╣реИ:

рдХрднреА-рдХрднреА, рдПрдХ рдмрдбрд╝реЗ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдореЗрдВ рдХрдИ рдЙрдк-рдбреЗрдЯрд╛ рд╕реЗрдЯ рд╢рд╛рдорд┐рд▓ рд╣реЛрддреЗ рд╣реИрдВ:
library(AppliedPredictiveModeling) data(solubility) ls(pattern="sol")
[1] "solTestX" "solTestXtrans" "solTestY" [4] "solTrainX" "solTrainXtrans" "solTrainY"
рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЛ рд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо рдлрдВрдХреНрд╢рди
рдордВрдж () ,
рд╣реЗрдб () ,
рдЯреЗрд▓ () рдФрд░
рд╕рд╛рд░рд╛рдВрд╢ () рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ ред
рдЯрд╛рдЗрдо рд╕реАрд░реАрдЬрд╝ рдПрдирд╛рд▓рд┐рдЯрд┐рдХреНрд╕
рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЛ рд╕рдордп рдХреЗ рд▓рдЧрд╛рддрд╛рд░ рдХреНрд╖рдгреЛрдВ рдореЗрдВ рдкреНрд░рд╛рдкреНрдд рдореВрд▓реНрдпреЛрдВ рдХреЗ рдПрдХ рд╕реЗрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рдЕрдХреНрд╕рд░ рдЙрдирдХреЗ рдмреАрдЪ рд╕рдорд╛рди рдЕрдВрддрд░рд╛рд▓ рдХреЗ рд╕рд╛рдеред рд╡рд╛рд░реНрд╖рд┐рдХ, рддреНрд░реИрдорд╛рд╕рд┐рдХ, рдорд╛рд╕рд┐рдХ, рд╕рд╛рдкреНрддрд╛рд╣рд┐рдХ рдФрд░ рджреИрдирд┐рдХ рдЬреИрд╕реЗ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдордп рд╣реЛрддреЗ рд╣реИрдВред рд╕рдХрд▓ рдШрд░реЗрд▓реВ рдЙрддреНрдкрд╛рдж (рд╕рдХрд▓ рдШрд░реЗрд▓реВ рдЙрддреНрдкрд╛рдж) рдХреА рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдХреЗ рд▓рд┐рдП рд╣рдо рдЖрдорддреМрд░ рдкрд░ рддреНрд░реИрдорд╛рд╕рд┐рдХ рдпрд╛ рд╡рд╛рд░реНрд╖рд┐рдХ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдЙрджреНрдзрд░рдг рдХреЗ рд▓рд┐рдП - рд╡рд╛рд░реНрд╖рд┐рдХ, рдорд╛рд╕рд┐рдХ рдФрд░ рджреИрдирд┐рдХ рдЖрд╡реГрддреНрддрд┐рдпреЛрдВред рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ, рд╣рдо рддреНрд░реИрдорд╛рд╕рд┐рдХ рдФрд░ рд╡рд╛рд░реНрд╖рд┐рдХ рдЕрд╡рдзрд┐ рдХреЗ рд▓рд┐рдП рдпреВрдПрд╕ рдЬреАрдбреАрдкреА рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:
ath<-"http://canisius.edu/~yany/RData/" dataSet<-"usGDPannual" con<-paste(path,dataSet,".RData",sep='') load(url(con)) head(.usGDPannual)
YEAR GDP 1 1930 92.2 2 1931 77.4 3 1932 59.5 4 1933 57.2 5 1934 66.8 6 1935 74.3
dataSet<-"usGDPquarterly" con<-paste(path,dataSet,".RData",sep='') load(url(con)) head(.usGDPquarterly)
DATE GDP_CURRENT GDP2009DOLLAR 1 1947Q1 243.1 1934.5 2 1947Q2 246.3 1932.3 3 1947Q3 250.1 1930.3 4 1947Q4 260.3 1960.7 5 1948Q1 266.2 1989.5 6 1948Q2 272.9 2021.9
рд╣рд╛рд▓рд╛рдВрдХрд┐, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рд▓рд┐рдП рдХрдИ рдкреНрд░рд╢реНрди рд╣реИрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдореИрдХреНрд░реЛрдЗрдХреЙрдиреЙрдорд┐рдХреНрд╕ рдХреЗ рджреГрд╖реНрдЯрд┐рдХреЛрдг рд╕реЗ, рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рд╡реНрдпрд╡рд╕рд╛рдп рдпрд╛ рдЖрд░реНрдерд┐рдХ рдЪрдХреНрд░ рд╣реИрдВред рдЙрджреНрдпреЛрдЧреЛрдВ рдпрд╛ рдХрдВрдкрдирд┐рдпреЛрдВ рдХреЗ рдкрд╛рд╕ рдореМрд╕рдо рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдХреГрд╖рд┐ рдЙрджреНрдпреЛрдЧ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реБрдП, рдХрд┐рд╕рд╛рди рд╡рд╕рдВрдд рдореЗрдВ рдЕрдзрд┐рдХ рдФрд░ рдЛрддреБрдУрдВ рдореЗрдВ рдФрд░ рд╕рд░реНрджрд┐рдпреЛрдВ рдореЗрдВ рдХрдо рдЦрд░реНрдЪ рдХрд░реЗрдВрдЧреЗред рдЦреБрджрд░рд╛ рд╡рд┐рдХреНрд░реЗрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП, рдЙрдирдХреЗ рдкрд╛рд╕ рд╡рд░реНрд╖ рдХреЗ рдЕрдВрдд рдореЗрдВ рдзрди рдХрд╛ рдПрдХ рдмрдбрд╝рд╛ рдкреНрд░рд╡рд╛рд╣ рд╣реЛрдЧрд╛ред
рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдореЗрдВ рд╣реЗрд░рдлреЗрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдо рдЖрд░ рдкреИрдХреЗрдЬ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдХрдИ рдЙрдкрдпреЛрдЧреА рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬрд┐рдиреНрд╣реЗрдВ
рдЯрд╛рдЗрдорд╕рд░реАрдЬ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдо рд╕рд╛рдкреНрддрд╛рд╣рд┐рдХ рдЖрд╡реГрддреНрддрд┐ рдХреЗ рд╕рд╛рде рджреИрдирд┐рдХ рдФрд╕рдд рдбреЗрдЯрд╛ рд▓реЗрддреЗ рд╣реИрдВ:
library(timeSeries) data(MSFT) x <- MSFT by <- timeSequence(from = start(x), to = end(x), by = "week") y<-aggregate(x,by,mean)
рд╣рдо рдХреБрдЫ рдЯрд┐рдкреНрдкрдгрд┐рдпреЛрдВ рдХреЛ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд┐рдП
рд╕рд┐рд░ () рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рднреА рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:
head(x)
GMT Open High Low Close Volume 2000-09-27 63.4375 63.5625 59.8125 60.6250 53077800 2000-09-28 60.8125 61.8750 60.6250 61.3125 26180200 2000-09-29 61.0000 61.3125 58.6250 60.3125 37026800 2000-10-02 60.5000 60.8125 58.2500 59.1250 29281200 2000-10-03 59.5625 59.8125 56.5000 56.5625 42687000 2000-10-04 56.3750 56.5625 54.5000 55.4375 68226700
head(y)
GMT Open High Low Close Volume 2000-09-27 63.4375 63.5625 59.8125 60.6250 53077800 2000-10-04 59.6500 60.0750 57.7000 58.5500 40680380 2000-10-11 54.9750 56.4500 54.1625 55.0875 36448900 2000-10-18 53.0375 54.2500 50.8375 52.1375 50631280 2000-10-25 61.7875 64.1875 60.0875 62.3875 86457340 2000-11-01 66.1375 68.7875 65.8500 67.9375 53496000
рднрд╡рд┐рд╖реНрдп рдХреА рдШрдЯрдирд╛рдУрдВ рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди
рдРрд╕реЗ рдХрдИ рддрд░реАрдХреЗ рд╣реИрдВ рдЬрд┐рдирдХрд╛ рдЙрдкрдпреЛрдЧ рд╣рдо рднрд╡рд┐рд╖реНрдп рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддреЗ рд╕рдордп рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬреИрд╕реЗ рдХрд┐ рдЪрд▓рддреА рдФрд╕рдд, рдкреНрд░рддрд┐рдЧрдорди, рдЖрддреНрдордХреЗрдВрджреНрд░рд┐рдд, рдЖрджрд┐ред рдкрд╣рд▓реЗ, рдЪрд▓ рдФрд╕рдд рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рд╕рд░рд▓ рдХреЗ рд╕рд╛рде рд╢реБрд░реВ рдХрд░реЗрдВ:
movingAverageFunction<- function(data,n=10){ out= data for(i in n:length(data)){ out[i] = mean(data[(i-n+1):i]) } return(out) }
рдкрд┐рдЫрд▓реЗ рдХреЛрдб рдореЗрдВ, рдЕрд╡рдзрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЗ рд▓рд┐рдП рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдорд╛рди 10. рд╣реИред рд╣рдо MSFT рдирд╛рдордХ рдПрдХ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдЬрд┐рд╕реЗ рдЖрд░ рдкреИрдХреЗрдЬ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рдЬрд┐рд╕реЗ
рдЯрд╛рдЗрдорд╕реАрд░реАрдЬ (рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рджреЗрдЦреЗрдВ):
library(timeSeries) data(MSFT) p<-MSFT$Close
[1] 60.6250 61.3125 60.3125 59.1250 56.5625 55.4375
head(ma)
[1] 60.62500 61.31250 60.75000 60.25000 58.66667 57.04167
mean(p[1:3])
[1] 60.75
mean(p[2:4])
[1] 60.25
рдореИрдиреБрдЕрд▓ рдореЛрдб рдореЗрдВ, рд╣рдо рдкрд╛рддреЗ рд╣реИрдВ рдХрд┐
x рдХреЗ рдкрд╣рд▓реЗ рддреАрди рдорд╛рдиреЛрдВ рдХрд╛ рдФрд╕рдд
y рдХреЗ рддреАрд╕рд░реЗ рдорд╛рди рд╕реЗ рдореЗрд▓ рдЦрд╛рддрд╛ рд╣реИред рдПрдХ рддрд░рд╣ рд╕реЗ, рд╣рдо рднрд╡рд┐рд╖реНрдп рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЪрд▓рддреА рдФрд╕рдд рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдЕрдЧрд▓реЗ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдо рдпрд╣ рджрд┐рдЦрд╛рдПрдВрдЧреЗ рдХрд┐ рдЕрдЧрд▓реЗ рд╡рд░реНрд╖ рдХреЗ рдЕрдиреБрдорд╛рдирд┐рдд рдмрд╛рдЬрд╛рд░ рд░рд┐рдЯрд░реНрди рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХреИрд╕реЗ рдХрд░реЗрдВред рдпрд╣рд╛рдВ рд╣рдо рдЕрдкрдиреЗ рдЕрдкреЗрдХреНрд╖рд┐рдд рдореВрд▓реНрдпреЛрдВ рдХреЗ рд░реВрдк рдореЗрдВ рдПрд╕ рдПрдВрдб рдкреА 500 рдЗрдВрдбреЗрдХреНрд╕ рдФрд░ рдРрддрд┐рд╣рд╛рд╕рд┐рдХ рдФрд╕рдд рд╡рд╛рд░реНрд╖рд┐рдХ рдореВрд▓реНрдп рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдкрд╣рд▓реЗ рдХреБрдЫ рдЖрджреЗрд╢реЛрдВ рдХреЛ
.sp500monthly рдирд╛рдордХ рд╕рдВрдмрдВрдзрд┐рдд рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ рд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдХрд╛рд░реНрдпрдХреНрд░рдо рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдФрд╕рдд рд╡рд╛рд░реНрд╖рд┐рдХ рдФрд╕рдд рдФрд░ 90 рдкреНрд░рддрд┐рд╢рдд рдЖрддреНрдорд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ рдХрд╛ рдЖрдХрд▓рди рдХрд░рдирд╛ рд╣реИ:
library(data.table) path<-'http://canisius.edu/~yany/RData/' dataSet<-'sp500monthly.RData' link<-paste(path,dataSet,sep='') load(url(link))
[min mean max ]
cat(min2,ourMean,max2,"\n")
0.05032956 0.09022369 0.1301178
рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рдкрд░рд┐рдгрд╛рдореЛрдВ рд╕реЗ рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВ, рдПрд╕ рдПрдВрдб рдкреА 500 рдХреЗ рд▓рд┐рдП рдРрддрд┐рд╣рд╛рд╕рд┐рдХ рдФрд╕рдд рд╡рд╛рд░реНрд╖рд┐рдХ рд░рд┐рдЯрд░реНрди 9% рд╣реИред рд▓реЗрдХрд┐рди рд╣рдо рдпрд╣ рдирд╣реАрдВ рдХрд╣ рд╕рдХрддреЗ рдХрд┐ рдЕрдЧрд▓реЗ рд╡рд░реНрд╖ рд╕реВрдЪрдХрд╛рдВрдХ рдХреА рд▓рд╛рднрдкреНрд░рджрддрд╛ 9% рд╣реЛрдЧреА, рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ 5% рд╕реЗ 13% рддрдХ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ, рдФрд░ рдпреЗ рдмрдбрд╝реЗ рдЙрддрд╛рд░-рдЪрдврд╝рд╛рд╡ рд╡рд╛рд▓реЗ рд╣реЛрддреЗ рд╣реИрдВред
рдореМрд╕рдо
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдо рд╕реНрд╡рд╛рдпрддреНрддрддрд╛ рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ рджрд┐рдЦрд╛рддреЗ рд╣реИрдВред рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рд╣рдо
рдПрд╕реНрдЯрд╛ рдирд╛рдордХ рдПрдХ рдЖрд░ рдкреИрдХреЗрдЬ рдбрд╛рдЙрдирд▓реЛрдб
рдХрд░рддреЗ рд╣реИрдВ , рдЬреЛ рд▓рд╛рдЧреВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рд▓рд┐рдП рд╣реИред рдлрд┐рд░ рд╣рдо рддреНрд░реИрдорд╛рд╕рд┐рдХ рдЖрд╡реГрддреНрддрд┐ рдХреЗ рд╕рд╛рде US GDP рд▓реЛрдб рдХрд░рддреЗ рд╣реИрдВ:
library(astsa) path<-"http://canisius.edu/~yany/RData/" dataSet<-"usGDPquarterly" con<-paste(path,dataSet,".RData",sep='') load(url(con)) x<-.usGDPquarterly$DATE y<-.usGDPquarterly$GDP_CURRENT plot(x,y) diff4 = diff(y,4) acf2(diff4,24)
рдЙрдкрд░реЛрдХреНрдд рдХреЛрдб рдореЗрдВ,
рдЕрдВрддрд░ () рдлрд╝рдВрдХреНрд╢рди рдЕрдВрддрд░ рдХреЛ рд╕реНрд╡реАрдХрд╛рд░ рдХрд░рддрд╛ рд╣реИ, рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд╡рд░реНрддрдорд╛рди рдорд╛рди рдкрд┐рдЫрд▓реЗ рдорд╛рди рдХреЛ рдШрдЯрд╛ рджреЗрддрд╛ рд╣реИред рдПрдХ рджреВрд╕рд░реА рдЗрдирдкреБрдЯ рд╡реИрд▓реНрдпреВ рджреЗрд░реА рдХрд╛ рд╕рдВрдХреЗрдд рджреЗрддреА рд╣реИред
рдПрд╕реАрдПрдл 2 () рдирд╛рдордХ рдПрдХ рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рдЙрдкрдпреЛрдЧ рдПрд╕реАрдПрдл рдФрд░ рдкреАрдПрд╕реАрдПрдл рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдмрдирд╛рдиреЗ рдФрд░ рдкреНрд░рд┐рдВрдЯ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред ACF рдХрд╛ рдЕрд░реНрде рд╣реИ рдСрдЯреЛрдХреНрд▓реЗрд╡реЗрд░рд┐рдпрди рдлрдВрдХреНрд╢рди, рдФрд░ PACF рдХрд╛ рдЕрд░реНрде рд╣реИ рдЖрдВрд╢рд┐рдХ рдСрдЯреЛрдХреИрд░реЗрд▓реЗрд╢рди рдлрдВрдХреНрд╢рдиред рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рд░реЗрдЦрд╛рдВрдХрди рдпрд╣рд╛рдВ рджрд┐рдЦрд╛рдП рдЧрдП рд╣реИрдВ:

рдШрдЯрдХ рджреГрд╢реНрдп
рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ, рдпрджрд┐ рд╣рдо рдЧреНрд░рд╛рдлрд╝ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рддреЛ рдЕрд╡рдзрд╛рд░рдгрд╛рдПрдВ рдФрд░ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдмрд╣реБрдд рдЕрдзрд┐рдХ рд╕рдордЭ рдореЗрдВ рдЖрдПрдВрдЧреЗред рдкрд┐рдЫрд▓реЗ рдкрд╛рдБрдЪ рджрд╢рдХреЛрдВ рдореЗрдВ рдЕрдореЗрд░рд┐рдХреА рдЬреАрдбреАрдкреА рдореЗрдВ рдЙрддрд╛рд░-рдЪрдврд╝рд╛рд╡ рдкрд╣рд▓рд╛ рдЙрджрд╛рд╣рд░рдг рджрд┐рдЦрд╛рддрд╛ рд╣реИ:
path<-"http://canisius.edu/~yany/RData/" dataSet<-"usGDPannual" con<-paste(path,dataSet,".RData",sep='') load(url(con)) title<-"US GDP" xTitle<-"Year" yTitle<-"US annual GDP" x<-.usGDPannual$YEAR y<-.usGDPannual$GDP plot(x,y,main=title,xlab=xTitle,ylab=yTitle)
рдЗрд╕реА рдЕрдиреБрд╕реВрдЪреА рдпрд╣рд╛рдБ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ:

рдпрджрд┐ рд╣рдордиреЗ рдЬреАрдбреАрдкреА рдХреЗ рд▓рд┐рдП рд▓рдШреБрдЧрдгрдХ рдкреИрдорд╛рдиреЗ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рд╣реИ, рддреЛ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рдФрд░ рдЧреНрд░рд╛рдл рд╣реЛрдВрдЧреЗ:
yTitle<-"Log US annual GDP" plot(x,log(y),main=title,xlab=xTitle,ylab=yTitle)
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЪрд╛рд░реНрдЯ рдПрдХ рд╕реАрдзреА рд░реЗрдЦрд╛ рдХреЗ рдХрд░реАрдм рд╣реИ:

рдЖрд░ рдкреИрдХреЗрдЬ - LiblineaR
рдпрд╣ рдкреИрдХреЗрдЬ LIBLINEAR C / C ++ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдПрдХ рд▓реАрдирд┐рдпрд░ рдкреНрд░реЗрдбрд┐рдХреНрдЯрд┐рд╡ рдореЙрдбрд▓ рд╣реИред рдпрд╣рд╛рдБ
рдЖрдИрд░рд┐рд╕ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рдПрдХ рдЙрджрд╛рд╣рд░рдг рд╣реИред рдХрд╛рд░реНрдпрдХреНрд░рдо рдпрд╣ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдбреЗрдЯрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд╕рдВрдпрдВрддреНрд░ рдХрд┐рд╕ рд╢реНрд░реЗрдгреА рдХрд╛ рд╣реИ:
library(LiblineaR) data(iris) attach(iris) x=iris[,1:4] y=factor(iris[,5]) train=sample(1:dim(iris)[1],100) xTrain=x[train,];xTest=x[-train,] yTrain=y[train]; yTest=y[-train] s=scale(xTrain,center=TRUE,scale=TRUE)
рдирд┐рд╖реНрдХрд░реНрд╖ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИред BCR рдПрдХ рд╕рдВрддреБрд▓рд┐рдд рд╡рд░реНрдЧреАрдХрд░рдг рджрд░ рд╣реИред рдЗрд╕ рд╢рд░реНрдд рдХреЗ рд▓рд┐рдП, рдЙрдЪреНрдЪрддрд░ рдмреЗрд╣рддрд░:
cat("Best model type is:",bestType,"\n")
Best model type is: 4
cat("Best cost is:",bestCost,"\n")
Best cost is: 1
cat("Best accuracy is:",bestAcc,"\n")
Best accuracy is: 0.98
print(res) yTest setosa versicolor virginica setosa 16 0 0 versicolor 0 17 0 virginica 0 3 14 print(BCR)
[1] 0.95
рдЖрд░ рдкреИрдХреЗрдЬ - рдЧреНрд░рд╣рдг
рдпрд╣ рдкреИрдХреЗрдЬ рдЙрдЪреНрдЪ-рдЖрдпрд╛рдореА рдбреЗрдЯрд╛ рдореЗрдВ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд┐рдП рдЧрдП рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдореЙрдбрд▓ рдХреЗ рд▓рд┐рдП рдПрдХ рдордзреНрдпрдо-рдЙрдиреНрдореБрдЦ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рд╣реИред рдкрд╣рд▓реЗ, рдЖрдЗрдП
рд╕рд┐рдордбрд╛рдЯрд╛ рдирд╛рдордХ рдПрдХ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЛ
рджреЗрдЦреЗрдВ рдЬрд┐рд╕рдореЗрдВ рдПрдХ рдкреИрдХреЗрдЬ рдХреЗ рд▓рд┐рдП рд╕рд┐рдореНрдпреБрд▓реЗрдЯреЗрдб рдбреЗрдЯрд╛ рд╣реИ:
library(eclust) data("simdata") dim(simdata)
[1] 100 502
simdata[1:5, 1:6]
YE Gene1 Gene2 Gene3 Gene4 [1,] -94.131497 0 -0.4821629 0.1298527 0.4228393 0.36643188 [2,] 7.134990 0 -1.5216289 -0.3304428 -0.4384459 1.57602830 [3,] 1.974194 0 0.7590055 -0.3600983 1.9006443 -1.47250061 [4,] -44.855010 0 0.6833635 1.8051352 0.1527713 -0.06442029 [5,] 23.547378 0 0.4587626 -0.3996984 -0.5727255 -1.75716775
table(simdata[,"E"])
0 1 50 50
рдкрд┐рдЫрд▓реЗ рдирд┐рд╖реНрдХрд░реНрд╖ рд╕реЗ рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдЖрдпрд╛рдо 50 рд╕реЗ 502 рд╣реИред
Y рдирд┐рд░рдВрддрд░ рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рд╡реЗрдХреНрдЯрд░ рд╣реИ, рдФрд░
E ECLUST рд╡рд┐рдзрд┐ рдХреЗ рд▓рд┐рдП рджреНрд╡рд┐рдЖрдзрд╛рд░реА рдкрд░реНрдпрд╛рд╡рд░рдг рдЪрд░ рд╣реИред рдПрдХреНрд╕рдкреЛрдЬрд╝реНрдб рдХреЗ рд▓рд┐рдП
E = 0 (n = 50) рдФрд░ рдЙрдЬрд╛рдЧрд░ рдХреЗ рд▓рд┐рдП
E = 1 ред
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрд╛рд░реНрдпрдХреНрд░рдо рдЖрд░ рдлрд┐рд╢рд░ рдЬреЗрдб-рдЯреНрд░рд╛рдВрд╕рдлреЙрд░реНрдореЗрд╢рди рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░рддрд╛ рд╣реИ:
library(eclust) data("simdata") X = simdata[,c(-1,-2)] firstCorr<-cor(X[1:50,]) secondCorr<-cor(X[51:100,]) score<-u_fisherZ(n0=100,cor0=firstCorr,n1=100,cor1=secondCorr) dim(score)
[1] 500 500
score[1:5,1:5]
Gene1 Gene2 Gene3 Gene4 Gene5 Gene1 1.000000 -8.062020 6.260050 -8.133437 -7.825391 Gene2 -8.062020 1.000000 9.162208 -7.431822 -7.814067 Gene3 6.260050 9.162208 1.000000 8.072412 6.529433 Gene4 -8.133437 -7.431822 8.072412 1.000000 -5.099261 Gene5 -7.825391 -7.814067 6.529433 -5.099261 1.000000
рд╣рдо рдлрд┐рд╢рд░ рдЬреЗрдб-рдЯреНрд░рд╛рдВрд╕рдлреЙрд░реНрдо рдХреЛ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рддреЗ рд╣реИрдВред рдпрд╣ рдорд╛рдирддреЗ рд╣реБрдП рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕
n рдЬреЛрдбрд╝реЗ
x i рдФрд░
y i рдХрд╛ рдПрдХ рд╕реЗрдЯ рд╣реИ, рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реВрддреНрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЙрдирдХреЗ рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛ рд╕рдХрддреЗ рд╣реИрдВ:

рдпрд╣рд╛рдБ
рдкреА рджреЛ рдЪрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рд╣реИ, рдФрд░

рдФрд░

рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдЪрд░
x рдФрд░
y рдХреЗ рд▓рд┐рдП рдирдореВрдирд╛ рд╕рд╛рдзрди рд╣реИрдВред
Z рдХрд╛ рдорд╛рди рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ:
ln рдкреНрд░рд╛рдХреГрддрд┐рдХ рд▓рдШреБрдЧрдгрдХ рдлрд╝рдВрдХреНрд╢рди рд╣реИ, рдФрд░
arctanh () рдЙрд▓рдЯрд╛ рд╣рд╛рдЗрдкрд░рдмреЛрд▓рд┐рдХ рд╕реНрдкрд░реНрд╢рд░реЗрдЦрд╛ рдлрд╝рдВрдХреНрд╢рди рд╣реИред
рдореЙрдбрд▓ рдЪрдпрди
рдПрдХ рдЕрдЪреНрдЫрд╛ рдореЙрдбрд▓ рдЦреЛрдЬрдиреЗ рдкрд░, рдХрднреА-рдХрднреА рд╣рдореЗрдВ рдбреЗрдЯрд╛ рдХреА рдХрдореА / рдЕрдзрд┐рдХрддрд╛ рдХрд╛ рд╕рд╛рдордирд╛ рдХрд░рдирд╛ рдкрдбрд╝рддрд╛ рд╣реИред рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЙрджрд╛рд╣рд░рдг
рдпрд╣рд╛рдБ рд╕реЗ рдЙрдзрд╛рд░ рд▓рд┐рдпрд╛
рдЧрдпрд╛ рд╣реИ ред рд╡рд╣ рдЗрд╕ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреА рд╕рдорд╕реНрдпрд╛рдУрдВ рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИ рдФрд░ рд╣рдо рдЧреИрд░-рд░реИрдЦрд┐рдХ рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рдЕрдиреБрдорд╛рдирд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдкрдж рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХреЗ рд╕рд╛рде рд░реИрдЦрд┐рдХ рдкреНрд░рддрд┐рдЧрдорди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдирд┐рд░реНрджрд┐рд╖реНрдЯ рд╕рдорд╛рд░реЛрд╣:

рдЕрдЧрд▓реЗ рдХрд╛рд░реНрдпрдХреНрд░рдо рдореЗрдВ, рд╣рдо рд╕рдореАрдХрд░рдг рдХреЛ рдЕрдиреБрдорд╛рдирд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд░реИрдЦрд┐рдХ рдФрд░ рдмрд╣реБрдкрдж рдореЙрдбрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддреЗ рд╣реИрдВред рдереЛрдбрд╝рд╛ рд╕рдВрд╢реЛрдзрд┐рдд рдХреЛрдб рдпрд╣рд╛рдВ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред рдХрд╛рд░реНрдпрдХреНрд░рдо рдбреЗрдЯрд╛ рдХреА рдХрдореА рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИ / рдореЙрдбрд▓ рдкрд░ рдУрд╡рд░рд╕реБрдкреНрд▓реА:
import sklearn import numpy as np import matplotlib.pyplot as plt from sklearn.pipeline import Pipeline from sklearn.preprocessing import PolynomialFeatures from sklearn.linear_model import LinearRegression from sklearn.model_selection import cross_val_score
рдкрд░рд┐рдгрд╛рдореА рд░реЗрдЦрд╛рдВрдХрди рдпрд╣рд╛рдВ рджрд┐рдЦрд╛рдП рдЧрдП рд╣реИрдВ:

рдкрд╛рдпрдерди рдкреИрдХреЗрдЬ - рдореЙрдбрд▓-рдХреИрдЯрд╡реЙрдХ
рдПрдХ рдЙрджрд╛рд╣рд░рдг
рдпрд╣рд╛рдВ рдкрд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛
рд╣реИ ред
рдХреЛрдб рдХреА рдкрд╣рд▓реА рдХреБрдЫ рдкрдВрдХреНрддрд┐рдпрд╛рдБ рдпрд╣рд╛рдБ рджрд┐рдЦрд╛рдИ рдЧрдИ рд╣реИрдВ:
import datetime import pandas from sqlalchemy import create_engine from metta import metta_io as metta from catwalk.storage import FSModelStorageEngine, CSVMatrixStore from catwalk.model_trainers import ModelTrainer from catwalk.predictors import Predictor from catwalk.evaluation import ModelEvaluator from catwalk.utils import save_experiment_and_get_hash help(FSModelStorageEngine)
рдЗрд╕реА рдирд┐рд╖реНрдХрд░реНрд╖ рдХреЛ рдпрд╣рд╛рдБ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред рд╕реНрдерд╛рди рдмрдЪрд╛рдиреЗ рдХреЗ рд▓рд┐рдП, рдХреЗрд╡рд▓ рдКрдкрд░реА рднрд╛рдЧ рдкреНрд░рд╕реНрддреБрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ:
Help on class FSModelStorageEngine in module catwalk.storage: class FSModelStorageEngine(ModelStorageEngine) | Method resolution order: | FSModelStorageEngine | ModelStorageEngine | builtins.object | | Methods defined here: | | __init__(self, *args, **kwargs) | Initialize self. See help(type(self)) for accurate signature. | | get_store(self, model_hash) | | ----------------------------------------------------------------------
| Data descriptors inherited from ModelStorageEngine: | | __dict__ | dictionary for instance variables (if defined) | | __weakref__ | list of weak references to the object (if defined)
рдЕрдЬрдЧрд░ рдкреИрдХреЗрдЬ - рд╕реНрдХреЗрд▓реЗрд░
рдЪреВрдБрдХрд┐
sklearn рдПрдХ рдмрд╣реБрдд рд╣реА рдЙрдкрдпреЛрдЧреА рдкреИрдХреЗрдЬ рд╣реИ, рдЗрд╕рд▓рд┐рдП рдпрд╣ рдЗрд╕ рдкреИрдХреЗрдЬ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рдФрд░ рдЕрдзрд┐рдХ рдЙрджрд╛рд╣рд░рдг рджрд┐рдЦрд╛рдиреЗ рд▓рд╛рдпрдХ рд╣реИред рдпрд╣рд╛рдВ рджрд┐рдП рдЧрдП рдЙрджрд╛рд╣рд░рдг рд╕реЗ рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ рдмреИрдЧ рдХреЗ рд╢рдмреНрджреЛрдВ рдХреЗ рджреГрд╖реНрдЯрд┐рдХреЛрдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рджрд╕реНрддрд╛рд╡реЗрдЬреЛрдВ рдХреЛ рд╡рд░реНрдЧреАрдХреГрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреИрдХреЗрдЬ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВред
рдпрд╣ рдЙрджрд╛рд╣рд░рдг рд╡рд╕реНрддреБрдУрдВ рдХреЛ рд╕рдВрдЧреНрд░рд╣реАрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП
scipy.sparse рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИ рдФрд░ рд╡рд┐рднрд┐рдиреНрди рд╡рд░реНрдЧреАрдХрд░рдгреЛрдВ рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдХреБрд╢рд▓рддрд╛ рд╕реЗ рд╡рд┐рд░рд▓
рдореИрдЯреНрд░рд┐рд╕ рдХреЛ рд╕рдВрд╕рд╛рдзрд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдпрд╣ рдЙрджрд╛рд╣рд░рдг 20 рд╕рдорд╛рдЪрд╛рд░ рд╕рдореВрд╣реЛрдВ рдХреЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред рдЗрд╕реЗ рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдк рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ рдФрд░ рдлрд┐рд░ рдХреИрд╢ рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред рдЬрд┐рдк рдлрд╛рдЗрд▓ рдореЗрдВ рдЗрдирдкреБрдЯ рдлрд╛рдЗрд▓реЗрдВ рд╣реЛрддреА рд╣реИрдВ рдФрд░ рдЗрдиреНрд╣реЗрдВ
рдпрд╣рд╛рдВ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛
рд╣реИ ред рдпрд╣рд╛рдВ рдХреЛрдб рдЙрдкрд▓рдмреНрдз
рд╣реИ ред рдЕрдВрддрд░рд┐рдХреНрд╖ рдХреЛ рдмрдЪрд╛рдиреЗ рдХреЗ рд▓рд┐рдП, рдХреЗрд╡рд▓ рдкрд╣рд▓реА рдХреБрдЫ рд▓рд╛рдЗрдиреЗрдВ рджрд┐рдЦрд╛рдИ рдЬрд╛рддреА рд╣реИрдВ:
import logging import numpy as np from optparse import OptionParser import sys from time import time import matplotlib.pyplot as plt from sklearn.datasets import fetch_20newsgroups from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.feature_extraction.text import HashingVectorizer from sklearn.feature_selection import SelectFromModel
рдЗрд╕реА рдЖрдЙрдЯрдкреБрдЯ рдХреЛ рдпрд╣рд╛рдБ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ:

рдкреНрд░рддреНрдпреЗрдХ рд╡рд┐рдзрд┐ рдХреЗ рд▓рд┐рдП рддреАрди рд╕рдВрдХреЗрддрдХ рд╣реИрдВ: рдореВрд▓реНрдпрд╛рдВрдХрди, рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕рдордп рдФрд░ рдкрд░реАрдХреНрд╖рдг рд╕рдордпред
рдЬреВрд▓рд┐рдпрд╛ рдкреИрдХреЗрдЬ - рдХреНрд╡рд╛рдВрдЯрдХреЙрди
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдорд╛рд░реНрдХреЛрд╡ рдЪреЗрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ:
using QuantEcon P = [0.4 0.6; 0.2 0.8]; mc = MarkovChain(P) x = simulate(mc, 100000); mean(x .== 1)
рдкрд░рд┐рдгрд╛рдо:

рдЙрджрд╛рд╣рд░рдг рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдпрд╣ рджреЗрдЦрдирд╛ рд╣реИ рдХрд┐ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдПрдХ рдЖрд░реНрдерд┐рдХ рд╕реНрдерд┐рддрд┐ рд╕реЗ рдПрдХ рд╡реНрдпрдХреНрддрд┐ рджреВрд╕рд░реЗ рдореЗрдВ рдХреИрд╕реЗ рдмрджрд▓ рдЬрд╛рддрд╛ рд╣реИред рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЪрд╛рд░реНрдЯ рдХреЛ рджреЗрдЦреЗрдВ:

рдЖрдЗрдП "рдЦрд░рд╛рдм" рд╕реНрдерд┐рддрд┐ рдХреЗ рд╕рд╛рде рдмрд╛рдПрдВ рдЕрдВрдбрд╛рдХрд╛рд░ рдХреЛ рджреЗрдЦреЗрдВред 0.9 рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдЗрд╕ рд╕реНрдерд┐рддрд┐ рд╡рд╛рд▓реЗ рд╡реНрдпрдХреНрддрд┐ рдХреЗ рдкрд╛рд╕ 90% рд╢реЗрд╖ рдЧрд░реАрдм рд╣реЛрдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рд╣реИ, рдФрд░ 10% рдордзреНрдпрдо рд╡рд░реНрдЧ рдореЗрдВ рдЬрд╛рддрд╛ рд╣реИред рдЗрд╕реЗ рдирд┐рдореНрди рдореИрдЯреНрд░рд┐рдХреНрд╕ рджреНрд╡рд╛рд░рд╛ рджрд░реНрд╢рд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рд╢реВрдиреНрдп рд╡рд╣рд╛рдВ рд╣реИрдВ рдЬрд╣рд╛рдВ рдиреЛрдбреНрд╕ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдмрдврд╝рдд рдирд╣реАрдВ рд╣реИ:

рдпрд╣ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рд░рд╛рдЬреНрдп, x рдФрд░ y, рдПрдХ рджреВрд╕рд░реЗ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВ рдпрджрд┐ рд╕рдХрд╛рд░рд╛рддреНрдордХ рдкреВрд░реНрдгрд╛рдВрдХ j рдФрд░ k рд╣реИрдВ, рдЬреИрд╕реЗ:

рдпрджрд┐ рд╕рднреА рд░рд╛рдЬреНрдп рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВ, рддреЛ рдПрдХ рдорд╛рд░реНрдХреЛрд╡ рд╢реНрд░реГрдВрдЦрд▓рд╛
рдкреА рдХреЛ рдЕрдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИ; рдпрджрд┐
x рдФрд░
y рдкреНрд░рддреНрдпреЗрдХ (x, y) рдХреЗ рд▓рд┐рдП рд░рд┐рдкреЛрд░реНрдЯ
рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВ ред рдирд┐рдореНрди рдХреЛрдб рдЗрд╕рдХреА рдкреБрд╖реНрдЯрд┐ рдХрд░реЗрдЧрд╛:
using QuantEcon P = [0.9 0.1 0.0; 0.4 0.4 0.2; 0.1 0.1 0.8]; mc = MarkovChain(P) is_irreducible(mc)
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЧреНрд░рд╛рдл рдПрдХ рдЪрд░рдо рдорд╛рдорд▓реЗ рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдПрдХ рдЧрд░реАрдм рд╡реНрдпрдХреНрддрд┐ рдХреЗ рд▓рд┐рдП рднрд╡рд┐рд╖реНрдп рдХреА рд╕реНрдерд┐рддрд┐ 100% рдЦрд░рд╛рдм рд╣реЛрдЧреА:

рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рднреА рдЗрд╕рдХреА рдкреБрд╖реНрдЯрд┐ рдХрд░реЗрдЧрд╛, рдХреНрдпреЛрдВрдХрд┐ рдкрд░рд┐рдгрд╛рдо
рдЧрд▓рдд рд╣реЛрдЧрд╛:
using QuantEcon P2 = [1.0 0.0 0.0; 0.1 0.8 0.1; 0.0 0.2 0.8]; mc2 = MarkovChain(P2) is_irreducible(mc2)
рдЧреНрд░реЗрдВрдЬрд░ рдХреЙрдЬреЗрд▓рд┐рдЯреА рдЯреЗрд╕реНрдЯ
рдЧреНрд░реЗрдВрдЬрд░ рдХрд╛рд░рдг рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдПрдХ рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдПрдХ рдХрд╛рд░рдХ рд╣реИ рдФрд░ рджреВрд╕рд░реА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧреА рдЬрд╛рдирдХрд╛рд░реА рдкреНрд░рджрд╛рди рдХрд░рддреА рд╣реИред рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рдПрдХ рдЪрд┐рддреНрд░рдг рдХреЗ рд░реВрдк рдореЗрдВ
ChickEgg рдирд╛рдо рдХреЗ
рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред рдбреЗрдЯрд╛ рд╕реЗрдЯ рдореЗрдВ рдЯрд╛рдЗрдорд╕реНрдЯреИрдореНрдк рдХреЗ рд╕рд╛рде рджреЛ рдХреЙрд▓рдо, рдореБрд░реНрдЧрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдФрд░ рдЕрдВрдбреЗ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╣реЛрддреА рд╣реИ:
library(lmtest) data(ChickEgg) dim(ChickEgg)
[1] 54 2
ChickEgg[1:5,]
chicken egg [1,] 468491 3581 [2,] 449743 3532 [3,] 436815 3327 [4,] 444523 3255 [5,] 433937 3156
рд╕рд╡рд╛рд▓ рдпрд╣ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рд╣рдо рдЕрдЧрд▓реЗ рд╕рд╛рд▓ рдореБрд░реНрдЧрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕ рд╕рд╛рд▓ рдЕрдВрдбреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ?
рдпрджрд┐ рдРрд╕рд╛ рд╣реИ, рддреЛ рдореБрд░реНрдЧрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдЕрдВрдбреЗ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЗ рд▓рд┐рдП рдЧреНрд░реЗрдВрдЬрд░ рдХрд╛рд░рдг рд╣реЛрдЧреАред рдпрджрд┐ рдпрд╣ рдорд╛рдорд▓рд╛ рдирд╣реАрдВ рд╣реИ, рддреЛ рд╣рдо рдХрд╣рддреЗ рд╣реИрдВ рдХрд┐ рдореБрд░реНрдЧрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдЕрдВрдбреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдЧреНрд░реЗрдВрдЬрд░ рдХрд╛рд░рдг рдирд╣реАрдВ рд╣реИред рдпрд╣рд╛рдБ рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдХреЛрдб рд╣реИ:
library(lmtest) data(ChickEgg) grangertest(chicken~egg, order = 3, data = ChickEgg)
Granger causality test Model 1: chicken ~ Lags(chicken, 1:3) + Lags(egg, 1:3) Model 2: chicken ~ Lags(chicken, 1:3) Res.Df Df F Pr(>F) 1 44 2 47 -3 5.405 0.002966 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
рдореЙрдбрд▓ 1 рдореЗрдВ, рд╣рдо рдЪреВрдЬреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕рдордЭрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЪрд┐рдХ рд▓реИрдЧреНрд╕ рдкреНрд▓рд╕ рдПрдЧ рд▓реИрдЧреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддреЗ рд╣реИрдВред
рдХреНрдпреЛрдВрдХрд┐
рдкреА рдХрд╛ рдореВрд▓реНрдп рдХрд╛рдлреА рдЫреЛрдЯрд╛ рд╣реИ (рдпрд╣ 0.01 рдкрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ), рд╣рдо рдХрд╣рддреЗ рд╣реИрдВ рдХрд┐ рдЕрдВрдбреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдореБрд░реНрдЧрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЗ рд▓рд┐рдП рдЧреНрд░реЗрдВрдЬрд░ рдХрд╛рд░рдг рд╣реИред
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдкрд░реАрдХреНрд╖рдг рд╕реЗ рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ рдореБрд░реНрдЧрд┐рдпреЛрдВ рдХреЗ рдбреЗрдЯрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЕрд╡рдзрд┐ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ:
grangertest(egg~chicken, order = 3, data = ChickEgg)
Granger causality test Model 1: egg ~ Lags(egg, 1:3) + Lags(chicken, 1:3) Model 2: egg ~ Lags(egg, 1:3) Res.Df Df F Pr(>F) 1 44 2 47 -3 0.5916 0.6238
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдо рдЖрдИрдмреАрдПрдо рдФрд░ рдПрд╕ рдПрдВрдб рдкреА 500 рдХреА рд▓рд╛рднрдкреНрд░рджрддрд╛ рдХреА рдЬрд╛рдВрдЪ рдХрд░рддреЗ рд╣реИрдВ рддрд╛рдХрд┐ рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛ рдЬрд╛ рд╕рдХреЗ рдХрд┐ рд╡реЗ рджреВрд╕рд░реЗ рдХреЗ рд▓рд┐рдП рдЧреНрд░реЗрдВрдЬрд░ рдХрд╛рд░рдг рд╣реИрдВред
рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рд╣рдо рдЙрдкрдЬ рд╕рдорд╛рд░реЛрд╣ рдХреЛ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд░рддреЗ рд╣реИрдВ:
ret_f<-function(x,ticker=""){ n<-nrow(x) p<-x[,6] ret<-p[2:n]/p[1:(n-1)]-1 output<-data.frame(x[2:n,1],ret) name<-paste("RET_",toupper(ticker),sep='') colnames(output)<-c("DATE",name) return(output) }
>x<-read.csv("http://canisius.edu/~yany/data/ibmDaily.csv",header=T) ibmRet<-ret_f(x,"ibm") x<-read.csv("http://canisius.edu/~yany/data/^gspcDaily.csv",header=T) mktRet<-ret_f(x,"mkt") final<-merge(ibmRet,mktRet) head(final)
DATE RET_IBM RET_MKT 1 1962-01-03 0.008742545 0.0023956877 2 1962-01-04 -0.009965497 -0.0068887673 3 1962-01-05 -0.019694350 -0.0138730891 4 1962-01-08 -0.018750380 -0.0077519519 5 1962-01-09 0.011829467 0.0004340133 6 1962-01-10 0.001798526 -0.0027476933
рдЕрдм рдлрд╝рдВрдХреНрд╢рди рдХреЛ рдЗрдирдкреБрдЯ рдорд╛рдиреЛрдВ рдХреЗ рд╕рд╛рде рдмреБрд▓рд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдХрд╛рд░реНрдпрдХреНрд░рдо рдХрд╛ рд▓рдХреНрд╖реНрдп рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рд╣рдо рдЖрдИрдмреАрдПрдо рдХреА рд▓рд╛рднрдкреНрд░рджрддрд╛ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╛рдЬрд╛рд░ рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдЙрд╕реА рддрд░рд╣, рд╣рдо рдмрд╛рдЬрд╛рд░ рдХреЗ рд░рд╛рдЬрд╕реНрд╡ рдореЗрдВ рдЖрдИрдмреАрдПрдо рдХреЗ рдЕрдВрддрд░рд╛рд▓ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд╛рдБрдЪ рдХрд░рддреЗ рд╣реИрдВ:
library(lmtest) grangertest(RET_IBM ~ RET_MKT, order = 1, data =final)
Granger causality test Model 1: RET_IBM ~ Lags(RET_IBM, 1:1) + Lags(RET_MKT, 1:1) Model 2: RET_IBM ~ Lags(RET_IBM, 1:1) Res.Df Df F Pr(>F) 1 14149 2 14150 -1 24.002 9.729e-07 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
рдкрд░рд┐рдгрд╛рдо рдмрддрд╛рддреЗ рд╣реИрдВ рдХрд┐ S & P500 рдХрд╛ рдЙрдкрдпреЛрдЧ рдЖрдИрдмреАрдПрдо рдХреА рдЕрдЧрд▓реА рдЕрд╡рдзрд┐ рдХреЗ рд▓рд┐рдП рд▓рд╛рднрдкреНрд░рджрддрд╛ рдХреЛ рд╕рдордЭрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ 0.1% рддрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд░реВрдк рд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИред рдирд┐рдореНрди рдХреЛрдб рдпрд╣ рджреЗрдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд╛рдВрдЪ рдХрд░реЗрдЧрд╛ рдХрд┐ рдХреНрдпрд╛ IBM рдХрд╛ рдЕрдВрддрд░рд╛рд▓ S & P500 рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрди рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рддрд╛ рд╣реИ:
grangertest(RET_MKT ~ RET_IBM, order = 1, data =final)
Granger causality test Model 1: RET_MKT ~ Lags(RET_MKT, 1:1) + Lags(RET_IBM, 1:1) Model 2: RET_MKT ~ Lags(RET_MKT, 1:1) Res.Df Df F Pr(>F) 1 14149 2 14150 -1 7.5378 0.006049 ** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
рдкрд░рд┐рдгрд╛рдо рдмрддрд╛рддрд╛ рд╣реИ рдХрд┐ рдЗрд╕ рдЕрд╡рдзрд┐ рдХреЗ рджреМрд░рд╛рди, рдЖрдИрдмреАрдПрдо рдХреЗ рд░рд┐рдЯрд░реНрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдЕрдЧрд▓реА рдЕрд╡рдзрд┐ рдХреЗ рд▓рд┐рдП рдПрд╕рдПрдВрдбрдкреА 500 рдЗрдВрдбреЗрдХреНрд╕ рдХреЛ рд╕рдордЭрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред