23 - RL

유튜브/대충 배우는 머신러닝 AI(영상삭제)

----___<<<<< 2020. 2. 24. 14:03

Reinforcement Learning에 대해서 알아봅니다.

실제로 우리가 학습하는 과정이랑 비슷합니다.

Agent가 어떤 행동을 했을 때, 잘 한 행동이면 +(reward)를 주면서 상태를 계속 지켜봅니다(observation).

이 행동의 반복을 통해서, reward를 많이 받은 행동이면 잘 했다고 판단을 합니다.

이 과정에서 openapi라는 강화학습을도와주는 라이브러리를 사용합니다.

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

-