유튜브/대충 배우는 머신러닝 AI(영상삭제)

23 - RL

개복치 개발자 2020. 2. 24. 14:03

Reinforcement Learning에 대해서 알아봅니다.

 

실제로 우리가 학습하는 과정이랑 비슷합니다.

 

 

Agent가 어떤 행동을 했을 때, 잘 한 행동이면 +(reward)를 주면서 상태를 계속 지켜봅니다(observation).

 

이 행동의 반복을 통해서, reward를 많이 받은 행동이면 잘 했다고 판단을 합니다.

 

 이 과정에서 openapi라는 강화학습을도와주는 라이브러리를 사용합니다.

 

 

 

 

 

 

'유튜브 > 대충 배우는 머신러닝 AI(영상삭제)' 카테고리의 다른 글

25 - DQN  (0) 2020.02.25
24 - Q Learning  (0) 2020.02.24
22 - RNN이란  (0) 2020.02.22
21 - CNN MNIST  (0) 2020.02.21
20 - CNN 이란  (0) 2020.02.21