Reinforcement Learning에 대해서 알아봅니다.
실제로 우리가 학습하는 과정이랑 비슷합니다.
Agent가 어떤 행동을 했을 때, 잘 한 행동이면 +(reward)를 주면서 상태를 계속 지켜봅니다(observation).
이 행동의 반복을 통해서, reward를 많이 받은 행동이면 잘 했다고 판단을 합니다.
이 과정에서 openapi라는 강화학습을도와주는 라이브러리를 사용합니다.
'유튜브 > 대충 배우는 머신러닝 AI(영상삭제)' 카테고리의 다른 글
25 - DQN (0) | 2020.02.25 |
---|---|
24 - Q Learning (0) | 2020.02.24 |
22 - RNN이란 (0) | 2020.02.22 |
21 - CNN MNIST (0) | 2020.02.21 |
20 - CNN 이란 (0) | 2020.02.21 |