23 - RL

유튜브/대충 배우는 머신러닝 AI(영상삭제)

----___<<<<< 2020. 2. 24. 14:03

Reinforcement Learning에 대해서 알아봅니다.

실제로 우리가 학습하는 과정이랑 비슷합니다.

Agent가 어떤 행동을 했을 때, 잘 한 행동이면 +(reward)를 주면서 상태를 계속 지켜봅니다(observation).

이 행동의 반복을 통해서, reward를 많이 받은 행동이면 잘 했다고 판단을 합니다.

이 과정에서 openapi라는 강화학습을도와주는 라이브러리를 사용합니다.

-