Q-learning 이란 강화학습 학습기법 중에 하나입니다. 기존의 학습 모델 없이도 학습을 할 수 있는 방법입니다. 여러 방식으로 시도하여, 가장 가중치가 높은 방법을 찾는 방식인데 이 방식으로 하면, 새로운(더 좋은)방법을 찾는 것을 그만두는 문제가 발생합니다. 때문에, Exploit과 Exploration이라는 개념이 생기게 됩니다. 아는 길을 따라갈 때랑, 아는 길을 따라가지 않을 때로 구분해서 처리하는데 E-greedy 라는 개념을 사용합니다. import gym import numpy as np import matplotlib.pyplot as plt from gym.envs.registration import register import random as pr register( id='Fro..