유튜브/대충 배우는 머신러닝 AI(영상삭제)
23 - RL
----___<<<<<
2020. 2. 24. 14:03
Reinforcement Learning에 대해서 알아봅니다.
실제로 우리가 학습하는 과정이랑 비슷합니다.
Agent가 어떤 행동을 했을 때, 잘 한 행동이면 +(reward)를 주면서 상태를 계속 지켜봅니다(observation).
이 행동의 반복을 통해서, reward를 많이 받은 행동이면 잘 했다고 판단을 합니다.
이 과정에서 openapi라는 강화학습을도와주는 라이브러리를 사용합니다.