рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐ рдФрд░ рдкреБрд░рд╕реНрдХрд╛рд░ рдЬреЛрдбрд╝рдХрд░ рд╕реНрдЯреЙрдХ-рдЖрдзрд╛рд░рд┐рдд рдХреНрдпреВ-рд▓рд░реНрдирд┐рдВрдЧ рдПрдЬреЗрдВрдЯ рдореЗрдВ рд╕реБрдзрд╛рд░

рдЕрдиреБрд╕реНрдорд╛рд░рдХ


рдирдорд╕реНрдХрд╛рд░, рд╣реЗрдмреНрд░! рдореИрдВ рдЖрдкрдХреЗ рдирдП рд▓реЗрдЦ рдХрд╛ рдПрдХ рдФрд░ рдЕрдиреБрд╡рд╛рдж рдорд╛рдзреНрдпрдо рд╕реЗ рдЖрдкрдХреЗ рдзреНрдпрд╛рди рдореЗрдВ рд▓рд╛рддрд╛ рд╣реВрдВред

рдкрд┐рдЫрд▓реА рдмрд╛рд░ ( рдкрд╣рд▓рд╛ рд▓реЗрдЦ ) ( рд╣реИрдмрд░ ), рд╣рдордиреЗ рдХреНрдпреВ-рд▓рд░реНрдирд┐рдВрдЧ рддрдХрдиреАрдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдПрдХ рдПрдЬреЗрдВрдЯ рдмрдирд╛рдпрд╛, рдЬреЛ рдирдХрд▓реА рдФрд░ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╡рд┐рдирд┐рдордп рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдкрд░ рд▓реЗрдирджреЗрди рдХрд░рддрд╛ рд╣реИ рдФрд░ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдХрд╛рд░реНрдпреЛрдВ рдХрд╛ рдпрд╣ рдХреНрд╖реЗрддреНрд░ рдкреНрд░рдмрд▓рд┐рдд рд╕реАрдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╣реИ рдпрд╛ рдирд╣реАрдВред

рдЗрд╕ рдмрд╛рд░ рд╣рдо рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдХреЗ рднреАрддрд░ рдЦрд╛рддреЗ рдХреА рдирд┐рд░реНрднрд░рддрд╛ рдХреЛ рдзреНрдпрд╛рди рдореЗрдВ рд░рдЦрддреЗ рд╣реБрдП рдПрдХ LSTM рдкрд░рдд рдЬреЛрдбрд╝реЗрдВрдЧреЗ рдФрд░ рдкреНрд░рд╕реНрддреБрддрд┐рдпреЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рдХреЛ рдкреБрд░рд╕реНрдХреГрдд рдХрд░реЗрдВрдЧреЗред

рдЫрд╡рд┐

рдореИрдВ рдЖрдкрдХреЛ рдпрд╛рдж рджрд┐рд▓рд╛ рджреВрдВ рдХрд┐ рдЕрд╡рдзрд╛рд░рдгрд╛ рдХреЛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдордиреЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдбреЗрдЯрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛:

рдЫрд╡рд┐

рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдбреЗрдЯрд╛: рд╕рдлреЗрдж рд╢реЛрд░ рдХреЗ рд╕рд╛рде рд╕рд╛рдЗрдиред

рд╕рд╛рдЗрди рдлрд╝рдВрдХреНрд╢рди рдкрд╣рд▓рд╛ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдмрд┐рдВрджреБ рдерд╛ред рджреЛ рд╡рдХреНрд░ рдПрдХ рдкрд░рд┐рд╕рдВрдкрддреНрддрд┐ рдХреА рдЦрд░реАрдж рдФрд░ рдмрд┐рдХреНрд░реА рдореВрд▓реНрдп рдХрд╛ рдЕрдиреБрдХрд░рдг рдХрд░рддреЗ рд╣реИрдВ, рдЬрд╣рд╛рдВ рдкреНрд░рд╕рд╛рд░ рдиреНрдпреВрдирддрдо рд▓реЗрдирджреЗрди рд▓рд╛рдЧрдд рд╣реИред

рд╣рд╛рд▓рд╛рдБрдХрд┐, рдЗрд╕ рдмрд╛рд░ рд╣рдо рдЗрд╕ рд╕рд░рд▓ рдХрд╛рд░реНрдп рдХреЛ рдХреНрд░реЗрдбрд┐рдЯ рдЕрд╕рд╛рдЗрдирдореЗрдВрдЯ рдкрде рдХрд╛ рд╡рд┐рд╕реНрддрд╛рд░ рдХрд░рддреЗ рд╣реБрдП рдЬрдЯрд┐рд▓ рдмрдирд╛рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ:

рдЫрд╡рд┐

рд╕рд┐рдВрдереЗрдЯрд┐рдХ рдбреЗрдЯрд╛: рд╕рдлреЗрдж рд╢реЛрд░ рдХреЗ рд╕рд╛рде рд╕рд╛рдЗрдиред

рд╕рд╛рдЗрдирд╕ рдЪрд░рдг рджреЛрдЧреБрдирд╛ рд╣реЛ рдЧрдпрд╛ рдерд╛ред

рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рд╡рд┐рд░рд▓ рдкреБрд░рд╕реНрдХрд╛рд░ рдЬреЛ рд╣рдо рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ, рд╡реЗ рд▓рдВрдмреЗ рд╕рдордп рддрдХ рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдореЗрдВ рдлреИрд▓рдиреЗ рдЪрд╛рд╣рд┐рдПред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╣рдо рдПрдХ рд╕рдХрд╛рд░рд╛рддреНрдордХ рдЗрдирд╛рдо рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рд╕рдВрднрд╛рд╡рдирд╛ рдХреЛ рдХрд╛рдлреА рдХрдо рдХрд░ рджреЗрддреЗ рд╣реИрдВ, рдХреНрдпреЛрдВрдХрд┐ рдПрдЬреЗрдВрдЯ рдХреЛ рд▓реЗрдирджреЗрди рдХреА рд▓рд╛рдЧрддреЛрдВ рдХреЛ рджреВрд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП 2 рдмрд╛рд░ рд▓рдВрдмреЗ рд╕рдордп рддрдХ рд╕рд╣реА рдХреНрд░рд┐рдпрд╛рдУрдВ рдХрд╛ рдХреНрд░рдо рдХрд░рдирд╛ рдкрдбрд╝рддрд╛ рдерд╛ред рджреЛрдиреЛрдВ рдХрд╛рд░рдХ рдЖрд░рдЖрдИрдПрд▓ рдХреЗ рд▓рд┐рдП рднреА рдХрд╛рд░реНрдп рдХреЛ рдЬрдЯрд┐рд▓ рдХрд░рддреЗ рд╣реИрдВ рдпрд╣рд╛рдВ рддрдХ тАЛтАЛрдХрд┐ рдПрдХ рд╕рд╛рдзрд╛рд░рдг рд▓рд╣рд░ рдХреЗ рд░реВрдк рдореЗрдВ рдРрд╕реА рд╕рд░рд▓ рдкрд░рд┐рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рднреАред

рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рд╣рдореЗрдВ рдпрд╛рдж рд╣реИ рдХрд┐ рд╣рдордиреЗ рдЗрд╕ рддрдВрддреНрд░рд┐рдХрд╛ рдиреЗрдЯрд╡рд░реНрдХ рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдерд╛:

рдЫрд╡рд┐

рдХреНрдпрд╛ рдЬреЛрдбрд╝рд╛ рдЧрдпрд╛ рдФрд░ рдХреНрдпреЛрдВ


LSTM


рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рд╣рдо рдПрдЬреЗрдВрдЯ рдХреЛ рдкреНрд░рдХреНрд╖реЗрдкрд╡рдХреНрд░ рдХреЗ рднреАрддрд░ рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреА рдЧрддрд┐рд╢реАрд▓рддрд╛ рдХреА рдЕрдзрд┐рдХ рд╕рдордЭ рджреЗрдирд╛ рдЪрд╛рд╣рддреЗ рдереЗред рд╕реАрдзреЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ, рдПрдЬреЗрдВрдЯ рдХреЛ рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЛ рдмреЗрд╣рддрд░ рдврдВрдЧ рд╕реЗ рд╕рдордЭрдирд╛ рдЪрд╛рд╣рд┐рдП: рдЙрд╕рдиреЗ рдЕрднреА рдФрд░ рдкрд┐рдЫрд▓реЗ рдХреБрдЫ рд╕рдордп рд╕реЗ рдХреНрдпрд╛ рдХрд┐рдпрд╛, рдФрд░ рд░рд╛рдЬреНрдп-рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд╡рд┐рддрд░рдг рдХреЗ рд╕рд╛рде-рд╕рд╛рде рдкреНрд░рд╛рдкреНрдд рдкреБрд░рд╕реНрдХрд╛рд░реЛрдВ рдХреЛ рдХреИрд╕реЗ рд╡рд┐рдХрд╕рд┐рдд рдХрд┐рдпрд╛ред рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐ рдкрд░рдд рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдареАрдХ рд╕реЗ рд╣рд▓ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдкреНрд░рдпреЛрдЧ рдХреЗ рдПрдХ рдирдП рд╕реЗрдЯ рдХреЛ рд▓реЙрдиреНрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдП рдЧрдП рдирдП рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдореЗрдВ рдЖрдкрдХрд╛ рд╕реНрд╡рд╛рдЧрдд рд╣реИ:

рдЫрд╡рд┐

рдХреГрдкрдпрд╛ рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдореИрдВрдиреЗ рд╡рд┐рд╡рд░рдг рдореЗрдВ рдереЛрдбрд╝рд╛ рд╕реБрдзрд╛рд░ рдХрд┐рдпрд╛ рд╣реИред рдкреБрд░рд╛рдиреЗ рдПрдирдПрди рд╕реЗ рдПрдХрдорд╛рддреНрд░ рдЕрдВрддрд░ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рдмрдВрдзреБрдЖ рдХреЗ рдмрдЬрд╛рдп рдкрд╣рд▓реЗ рдЫрд┐рдкреА рд╣реБрдИ рдПрд▓рдПрд╕рдЯреАрдПрдо рдкрд░рдд рд╣реИред

рдХреГрдкрдпрд╛ рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдХрд╛рдо рдореЗрдВ LSTM рдХреЗ рд╕рд╛рде, рд╣рдореЗрдВ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рдЕрдиреБрднрд╡ рдХреЗ рдкреНрд░рдЬрдирди рдХреЗ рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХреЗ рдЪрдпрди рдХреЛ рдмрджрд▓рдирд╛ рд╣реЛрдЧрд╛: рдЕрдм рд╣рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХреЗ рдмрдЬрд╛рдп рд╕рдВрдХреНрд░рдордг рдЕрдиреБрдХреНрд░рдореЛрдВ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдпрд╣рд╛рдВ рдмрддрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдХреИрд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ (рдпрд╣ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдореЗрдВ рд╕реЗ рдПрдХ рд╣реИ)ред рд╣рдордиреЗ рдкрд╣рд▓реЗ рдирдореВрдиреЗ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдерд╛:

рдЫрд╡рд┐

рдкреНрд▓реЗрдмреИрдХ рдмрдлрд░ рдХреА рдХрд╛рд▓реНрдкрдирд┐рдХ рдпреЛрдЬрдирд╛ред

рд╣рдо LSTM рдХреЗ рд╕рд╛рде рдЗрд╕ рдпреЛрдЬрдирд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ:

рдЫрд╡рд┐

рдЕрдм рдЕрдиреБрдХреНрд░рдо рдЪреБрдиреЗ рдЧрдП рд╣реИрдВ (рдЬрд┐рдирдХреА рд▓рдВрдмрд╛рдИ рд╣рдо рдЖрдиреБрднрд╡рд┐рдХ рд░реВрдк рд╕реЗ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рддреЗ рд╣реИрдВ)ред

рдкрд╣рд▓реЗ рдХреА рддрд░рд╣, рдФрд░ рдЕрдм рдЯреЗрдореНрдкреЛрд░рд▓-рдЯреЗрдореНрдкреЛрд░рд▓ рд▓рд░реНрдирд┐рдВрдЧ рдХреА рддреНрд░реБрдЯрд┐рдпреЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдирдореВрдирд╛ рдХреЛ рдПрдХ рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рджреНрд╡рд╛рд░рд╛ рд╡рд┐рдирд┐рдпрдорд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

LSTM рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐ рд╕реНрддрд░ рдЕрддреАрдд рдХреЗ рдЕрдВрддрд░рд╛рд▓ рдореЗрдВ рдЫрд┐рдкреЗ рдПрдХ рдЕрддрд┐рд░рд┐рдХреНрдд рд╕рд┐рдЧреНрдирд▓ рдХреЛ рд░реЛрдХрдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рд╕реЗ рд╕реВрдЪрдирд╛ рдХреЗ рд╕реАрдзреЗ рдкреНрд░рд╕рд╛рд░ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред рд╣рдорд╛рд░реЗ рд╕рд╛рде рд╕рдордп рд╢реНрд░реГрдВрдЦрд▓рд╛ рдЖрдХрд╛рд░ рдХреЗ рд╕рд╛рде рдПрдХ рджреЛ рдЖрдпрд╛рдореА рдЯреЗрдВрд╕рд░ рд╣реИ: рд╣рдорд╛рд░реЗ рд░рд╛рдЬреНрдп-рдХрд╛рд░реНрд░рд╡рд╛рдИ рдХреЗ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдкрд░ рдЕрдиреБрдХреНрд░рдо рдХреА рд▓рдВрдмрд╛рдИред

рдкреНрд░рд╕реНрддреБрддрд┐рдпреЛрдВ


рдХреНрд╖рдорддрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдкреБрд░рд╕реНрдХрд╛рд░ рд╡рд┐рдЬреЗрддрд╛ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ, рдкреЛрдЯреЗрдВрд╢рд┐рдпрд▓ рдмреЗрд╕реНрдб рд░рд┐рд╡рд╛рд░реНрдб рд╢реЗрдкрд┐рдВрдЧ (PBRS) рдПрдХ рд╢рдХреНрддрд┐рд╢рд╛рд▓реА рдЙрдкрдХрд░рдг рд╣реИ рдЬреЛ рдЖрдкрдХреЛ рд╣рдорд╛рд░реЗ рдкрд░реНрдпрд╛рд╡рд░рдг рдХреЛ рд╣рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдиреАрддрд┐ рдЦреЛрдЬ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреА рдЕрдиреБрдХреВрд▓рддрд╛ рдХреА рдЧрддрд┐, рд╕реНрдерд┐рд░рддрд╛ рдХреЛ рдмрдврд╝рд╛рдиреЗ рдФрд░ рдЙрд▓реНрд▓рдВрдШрди рди рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред рдореИрдВ рдЗрд╕ рд╡рд┐рд╖рдп рдкрд░ рдХрдо рд╕реЗ рдХрдо рдЗрд╕ рдореВрд▓ рджрд╕реНрддрд╛рд╡реЗрдЬ рдХреЛ рдкрдврд╝рдиреЗ рдХреА рд╕рд▓рд╛рд╣ рджреЗрддрд╛ рд╣реВрдВ:

people.eecs.berkeley.edu/~russell/papers/ml99-shaping.ps

рд╕рдВрднрд╛рд╡рд┐рдд рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рд╣рдорд╛рд░рд╛ рд╡рд░реНрддрдорд╛рди рд░рд╛рдЬреНрдп рд▓рдХреНрд╖реНрдп рд░рд╛рдЬреНрдп рдХреЗ рд╕рд╛рдкреЗрдХреНрд╖ рдХрд┐рддрдирд╛ рдЕрдЪреНрдЫрд╛ рд╣реИ рдЬрд┐рд╕реЗ рд╣рдо рджрд░реНрдЬ рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдпрд╣ рдХреИрд╕реЗ рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ рдЗрд╕рдХрд╛ рдПрдХ рдпреЛрдЬрдирд╛рдмрджреНрдз рджреГрд╖реНрдЯрд┐рдХреЛрдг:

рдЫрд╡рд┐

рдРрд╕реЗ рд╡рд┐рдХрд▓реНрдк рдФрд░ рдХрдард┐рдирд╛рдЗрдпрд╛рдБ рд╣реИрдВ рдЬрд┐рдиреНрд╣реЗрдВ рдЖрдк рдкрд░реАрдХреНрд╖рдг рдФрд░ рддреНрд░реБрдЯрд┐ рдХреЗ рдмрд╛рдж рд╕рдордЭ рд╕рдХрддреЗ рд╣реИрдВ, рдФрд░ рд╣рдо рдЗрди рд╡рд┐рд╡рд░рдгреЛрдВ рдХреЛ рдЫреЛрдбрд╝ рджреЗрддреЗ рд╣реИрдВ, рдЬреЛ рдЖрдкрдХреЛ рдЖрдкрдХреЗ рд╣реЛрдорд╡рд░реНрдХ рдХреЗ рд╕рд╛рде рдЫреЛрдбрд╝ рджреЗрддреЗ рд╣реИрдВред

рдпрд╣ рдПрдХ рдФрд░ рдмрд╛рдд рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд░рдиреЗ рдпреЛрдЧреНрдп рд╣реИ, рдЬреЛ рдпрд╣ рд╣реИ рдХрд┐ рдкреАрдмреАрдЖрд░рдПрд╕ рдХреЛ рдкреНрд░рд╕реНрддреБрддрд┐рдпреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдЙрдЪрд┐рдд рдард╣рд░рд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рдЬреЛ рдкрд░реНрдпрд╛рд╡рд░рдг рдореЗрдВ рдПрдЬреЗрдВрдЯ рдХреЗ рд▓рдЧрднрдЧ рдЗрд╖реНрдЯрддрдо рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ (рдпрд╛ рд╕рд┐рдореНрдпреБрд▓реЗрдЯреЗрдб) рдЬреНрдЮрд╛рди рдХрд╛ рдПрдХ рд░реВрдк рд╣реИред рдЕрдиреБрдХреВрд▓рди рдпреЛрдЬрдирд╛рдУрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╣рдорд╛рд░реЗ рдХрд╛рд░реНрдп рдХреЗ рд▓рд┐рдП рдРрд╕реА рдкреНрд░рд╕реНрддреБрддрд┐рдпрд╛рдБ рдЦреЛрдЬрдиреЗ рдХрд╛ рдПрдХ рддрд░реАрдХрд╛ рд╣реИред рд╣рдо рдЦреЛрдЬ рдХреЗ рд╡рд┐рд╡рд░рдг рдХреЛ рдЫреЛрдбрд╝ рджреЗрддреЗ рд╣реИрдВред

рд╕рдВрднрд╛рд╡рд┐рдд рдЗрдирд╛рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд░реВрдк рд▓реЗрддрд╛ рд╣реИ (рд╕рдореАрдХрд░рдг 1):

r '= r + рдЧрд╛рдорд╛ * F (s') - F (s)

рдЬрд╣рд╛рдВ рдПрдл рд░рд╛рдЬреНрдп рдХреА рдХреНрд╖рдорддрд╛ рд╣реИ, рдФрд░ рдЖрд░ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рдЗрдирд╛рдо рд╣реИ, рдЧрд╛рдорд╛ рдЫреВрдЯ рдХрд╛рд░рдХ рд╣реИ (0: 1)ред

рдЗрди рд╡рд┐рдЪрд╛рд░реЛрдВ рдХреЗ рд╕рд╛рде, рд╣рдо рдХреЛрдбрд┐рдВрдЧ рдХреА рдУрд░ рдмрдврд╝рддреЗ рд╣реИрдВред

рдЖрд░ рдореЗрдВ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди
рдпрд╣рд╛рдБ рдХреЗрд░ рдиреЗрдЯрд╡рд░реНрдХ API рдкрд░ рдЖрдзрд╛рд░рд┐рдд рддрдВрддреНрд░рд┐рдХрд╛ рдиреЗрдЯрд╡рд░реНрдХ рдХреЛрдб рд╣реИ:

рдХреЛрдб
# configure critic NN тАФ тАФ тАФ тАФ тАФ тАФ library('keras') library('R6') state_names_length <- 12 # just for example lstm_seq_length <- 4 learning_rate <- 1e-3 a_CustomLayer <- R6::R6Class( тАЬCustomLayerтАЭ , inherit = KerasLayer , public = list( call = function(x, mask = NULL) { x тАФ k_mean(x, axis = 2, keepdims = T) } ) ) a_normalize_layer <- function(object) { create_layer(a_CustomLayer, object, list(name = 'a_normalize_layer')) } v_CustomLayer <- R6::R6Class( тАЬCustomLayerтАЭ , inherit = KerasLayer , public = list( call = function(x, mask = NULL) { k_concatenate(list(x, x, x), axis = 2) } , compute_output_shape = function(input_shape) { output_shape = input_shape output_shape[[2]] <- input_shape[[2]] * 3L output_shape } ) ) v_normalize_layer <- function(object) { create_layer(v_CustomLayer, object, list(name = 'v_normalize_layer')) } noise_CustomLayer <- R6::R6Class( тАЬCustomLayerтАЭ , inherit = KerasLayer , lock_objects = FALSE , public = list( initialize = function(output_dim) { self$output_dim <- output_dim } , build = function(input_shape) { self$input_dim <- input_shape[[2]] sqr_inputs <- self$input_dim ** (1/2) self$sigma_initializer <- initializer_constant(.5 / sqr_inputs) self$mu_initializer <- initializer_random_uniform(minval = (-1 / sqr_inputs), maxval = (1 / sqr_inputs)) self$mu_weight <- self$add_weight( name = 'mu_weight', shape = list(self$input_dim, self$output_dim), initializer = self$mu_initializer, trainable = TRUE ) self$sigma_weight <- self$add_weight( name = 'sigma_weight', shape = list(self$input_dim, self$output_dim), initializer = self$sigma_initializer, trainable = TRUE ) self$mu_bias <- self$add_weight( name = 'mu_bias', shape = list(self$output_dim), initializer = self$mu_initializer, trainable = TRUE ) self$sigma_bias <- self$add_weight( name = 'sigma_bias', shape = list(self$output_dim), initializer = self$sigma_initializer, trainable = TRUE ) } , call = function(x, mask = NULL) { #sample from noise distribution e_i = k_random_normal(shape = list(self$input_dim, self$output_dim)) e_j = k_random_normal(shape = list(self$output_dim)) #We use the factorized Gaussian noise variant from Section 3 of Fortunato et al. eW = k_sign(e_i) * (k_sqrt(k_abs(e_i))) * k_sign(e_j) * (k_sqrt(k_abs(e_j))) eB = k_sign(e_j) * (k_abs(e_j) ** (1/2)) #See section 3 of Fortunato et al. noise_injected_weights = k_dot(x, self$mu_weight + (self$sigma_weight * eW)) noise_injected_bias = self$mu_bias + (self$sigma_bias * eB) output = k_bias_add(noise_injected_weights, noise_injected_bias) output } , compute_output_shape = function(input_shape) { output_shape <- input_shape output_shape[[2]] <- self$output_dim output_shape } ) ) noise_add_layer <- function(object, output_dim) { create_layer( noise_CustomLayer , object , list( name = 'noise_add_layer' , output_dim = as.integer(output_dim) , trainable = T ) ) } critic_input <- layer_input( shape = list(NULL, as.integer(state_names_length)) , name = 'critic_input' ) common_lstm_layer <- layer_lstm( units = 20 , activation = тАЬtanhтАЭ , recurrent_activation = тАЬhard_sigmoidтАЭ , use_bias = T , return_sequences = F , stateful = F , name = 'lstm1' ) critic_layer_dense_v_1 <- layer_dense( units = 10 , activation = тАЬtanhтАЭ ) critic_layer_dense_v_2 <- layer_dense( units = 5 , activation = тАЬtanhтАЭ ) critic_layer_dense_v_3 <- layer_dense( units = 1 , name = 'critic_layer_dense_v_3' ) critic_layer_dense_a_1 <- layer_dense( units = 10 , activation = тАЬtanhтАЭ ) # critic_layer_dense_a_2 <- layer_dense( # units = 5 # , activation = тАЬtanhтАЭ # ) critic_layer_dense_a_3 <- layer_dense( units = length(actions) , name = 'critic_layer_dense_a_3' ) critic_model_v <- critic_input %>% common_lstm_layer %>% critic_layer_dense_v_1 %>% critic_layer_dense_v_2 %>% critic_layer_dense_v_3 %>% v_normalize_layer critic_model_a <- critic_input %>% common_lstm_layer %>% critic_layer_dense_a_1 %>% #critic_layer_dense_a_2 %>% noise_add_layer(output_dim = 5) %>% critic_layer_dense_a_3 %>% a_normalize_layer critic_output <- layer_add( list( critic_model_v , critic_model_a ) , name = 'critic_output' ) critic_model_1 <- keras_model( inputs = critic_input , outputs = critic_output ) critic_optimizer = optimizer_adam(lr = learning_rate) keras::compile( critic_model_1 , optimizer = critic_optimizer , loss = 'mse' , metrics = 'mse' ) train.x <- array_reshape(rnorm(10 * lstm_seq_length * state_names_length) , dim = c(10, lstm_seq_length, state_names_length) , order = 'C') predict(critic_model_1, train.x) layer_name <- 'noise_add_layer' intermediate_layer_model <- keras_model(inputs = critic_model_1$input, outputs = get_layer(critic_model_1, layer_name)$output) predict(intermediate_layer_model, train.x)[1,] critic_model_2 <- critic_model_1 


рдЕрдкрдиреА рдЕрдВрддрд░рд╛рддреНрдорд╛ рдХреА рдЖрд╡рд╛рдЬ рдкрд░ рдЕрдкрдирд╛ рдлреИрд╕рд▓рд╛ ...

рдкрд░рд┐рдгрд╛рдо рдФрд░ рддреБрд▓рдирд╛


рдЪрд▓реЛ рдЕрдВрдд рдкрд░рд┐рдгрд╛рдореЛрдВ рдореЗрдВ рд╕рд╣реА рдЧреЛрддрд╛ рд▓рдЧрд╛рдПрдБред рдиреЛрдЯ: рд╕рднреА рдкрд░рд┐рдгрд╛рдо рдмрд┐рдВрджреБ рдЕрдиреБрдорд╛рди рд╣реИрдВ рдФрд░ рд╡рд┐рднрд┐рдиреНрди рд░реИрдВрдбрдо рд╕реАрдбреНрд╕ рдХреЗ рд╕рд╛рде рдХрдИ рд░рди рдкрд░ рднрд┐рдиреНрди рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВред

рддреБрд▓рдирд╛ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:

  • LSTM рдФрд░ рдкреНрд░рд╕реНрддреБрддрд┐рдпреЛрдВ рдХреЗ рдмрд┐рдирд╛ рдкрд┐рдЫрд▓реЗ рд╕рдВрд╕реНрдХрд░рдг
  • рд╕рд░рд▓ 2-рддрддреНрд╡ LSTM
  • 4-рддрддреНрд╡ рдПрд▓рдПрд╕рдЯреАрдПрдо
  • рдкреАрдмреАрдЖрд░рдПрд╕ рдкреБрд░рд╕реНрдХрд╛рд░ рдХреЗ рд╕рд╛рде 4-рд╕реЗрд▓ рдПрд▓рдПрд╕рдЯреАрдПрдо рдЙрддреНрдкрдиреНрди

рдЫрд╡рд┐

1000 рдПрдкрд┐рд╕реЛрдб рд╕реЗ рдЕрдзрд┐рдХ рдФрд╕рдд рдкреНрд░рддрд┐ рдПрдкрд┐рд╕реЛрдб рдФрд╕рдд рд░рд┐рдЯрд░реНрдиред

рдЫрд╡рд┐

рдХреБрд▓ рдПрдкрд┐рд╕реЛрдб рдХреА рд╡рд╛рдкрд╕реАред

рд╕рдмрд╕реЗ рд╕рдлрд▓ рдПрдЬреЗрдВрдЯ рдХреЗ рд▓рд┐рдП рдЪрд╛рд░реНрдЯ:

рдЫрд╡рд┐

рдЫрд╡рд┐

рдПрдЬреЗрдВрдЯ рдкреНрд░рджрд░реНрд╢рдиред

рдареАрдХ рд╣реИ, рдпрд╣ рд╕реНрдкрд╖реНрдЯ рд╣реИ рдХрд┐ рдкреАрдмреАрдЖрд░рдПрд╕ рдХреЗ рд░реВрдк рдореЗрдВ рдПрдЬреЗрдВрдЯ рдкрд╣рд▓реЗ рдХреЗ рдкреНрд░рдпрд╛рд╕реЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЗрддрдиреА рдЬрд▓реНрджреА рдФрд░ рджреГрдврд╝рддрд╛ рд╕реЗ рдЬреБрдЯрддрд╛ рд╣реИ рдХрд┐ рдЗрд╕реЗ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдкрд░рд┐рдгрд╛рдо рдХреЗ рд░реВрдк рдореЗрдВ рд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдкреНрд░рд╕реНрддреБрддрд┐рдпреЛрдВ рдХреЗ рдмрд┐рдирд╛ рдЧрддрд┐ рд▓рдЧрднрдЧ 4-5 рдЧреБрдирд╛ рдЕрдзрд┐рдХ рд╣реИред рд╕реНрдерд┐рд░рддрд╛ рдЕрджреНрднреБрдд рд╣реИред

рдЬрдм LSTM рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдмрд╛рдд рдЖрддреА рд╣реИ, рддреЛ 4 рдХреЛрд╢рд┐рдХрд╛рдУрдВ рдиреЗ 2 рдХреЛрд╢рд┐рдХрд╛рдУрдВ рд╕реЗ рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд┐рдпрд╛ред рдПрдХ 2-рд╕реЗрд▓ LSTM рдиреЗ рдПрдХ рдЧреИрд░-LSTM рд╕рдВрд╕реНрдХрд░рдг рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд┐рдпрд╛ (рд╣рд╛рд▓рд╛рдВрдХрд┐, рд╢рд╛рдпрдж рдпрд╣ рдПрдХ рдПрдХрд▓ рдкреНрд░рдпреЛрдЧ рдХрд╛ рднреНрд░рдо рд╣реИ)ред

рдЕрдВрддрд┐рдо рд╢рдмреНрдж


рд╣рдордиреЗ рджреЗрдЦрд╛ рд╣реИ рдХрд┐ рдкреБрдирд░рд╛рд╡реГрддреНрддрд┐ рдФрд░ рдХреНрд╖рдорддрд╛-рдирд┐рд░реНрдорд╛рдг рдкреБрд░рд╕реНрдХрд╛рд░ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред рдореБрдЭреЗ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдкрд╕рдВрдж рдЖрдпрд╛ рдХрд┐ рдкреАрдмреАрдЖрд░рдПрд╕ рдиреЗ рдЗрддрдирд╛ рдЙрдЪреНрдЪ рдкреНрд░рджрд░реНрд╢рди рдХреИрд╕реЗ рдХрд┐рдпрд╛ред

рдХрд┐рд╕реА рдкрд░ рд╡рд┐рд╢реНрд╡рд╛рд╕ рди рдХрд░реЗрдВ рдЬреЛ рдореБрдЭреЗ рдпрд╣ рдХрд╣рддрд╛ рд╣реИ рдХрд┐ рдПрдХ рдЖрд░рдПрд▓ рдПрдЬреЗрдВрдЯ рдмрдирд╛рдирд╛ рдЖрд╕рд╛рди рд╣реИ рдЬреЛ рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рд╣реЛрддрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдПрдХ рдЭреВрда рд╣реИред рд╕рд┐рд╕реНрдЯрдо рдореЗрдВ рдЬреЛрдбрд╝рд╛ рдЧрдпрд╛ рдкреНрд░рддреНрдпреЗрдХ рдирдпрд╛ рдШрдЯрдХ рд╕рдВрднрд╛рд╡рд┐рдд рд░реВрдк рд╕реЗ рдЗрд╕реЗ рдХрдо рд╕реНрдерд┐рд░ рдмрдирд╛рддрд╛ рд╣реИ рдФрд░ рдЗрд╕рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рд╕рд╛рд░реЗ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░реЗрд╢рди рдФрд░ рдбреАрдмрдЧрд┐рдВрдЧ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред

рдлрд┐рд░ рднреА, рдЗрд╕ рдмрд╛рдд рдХреЗ рд╕реНрдкрд╖реНрдЯ рдкреНрд░рдорд╛рдг рд╣реИрдВ рдХрд┐ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рдХреЗрд╡рд▓ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдП рдЧрдП рддрд░реАрдХреЛрдВ (рдбреЗрдЯрд╛ рдмрд░рдХрд░рд╛рд░ рд░рд╣рд╛) рдореЗрдВ рд╕реБрдзрд╛рд░ рдХрд░рдХреЗ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдпрд╣ рдПрдХ рддрдереНрдп рд╣реИ рдХрд┐ рдХрд┐рд╕реА рднреА рдХрд╛рд░реНрдп рдХреЗ рд▓рд┐рдП рдорд╛рдкрджрдВрдбреЛрдВ рдХреА рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рд╕реАрдорд╛ рджреВрд╕рд░реЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмреЗрд╣рддрд░ рдХрд╛рдо рдХрд░рддреА рд╣реИред рдЗрд╕реЗ рдзреНрдпрд╛рди рдореЗрдВ рд░рдЦрддреЗ рд╣реБрдП, рдЖрдк рдПрдХ рд╕рдлрд▓ рд╢рд┐рдХреНрд╖рдг рдорд╛рд░реНрдЧ рдкрд░ рдЪрд▓ рд░рд╣реЗ рд╣реИрдВред

рдЖрдкрдХрд╛ рдзрдиреНрдпрд╡рд╛рдж

Source: https://habr.com/ru/post/hi436628/


All Articles