사이트 로그인
Sutton 교수님 책의 Chapter 4. Dynamic Programming을 보고 노트로 정리해 봤습니다.
강화학습 쪽은 워낙 정리된 자료가 많아서 개인 공부를 위해 필기로만 정리해봤습니다.
개인적으로 Silver 교수님의 동영상 강의는 영어가 부족해서 그런지 약간 지루하고,
이웅원 님 책으로 대충 보고 Sutton 교수님 책을 보니 디테일까지 이해가 되네요.
이론 정리 노트와 OpenAI Gym 으로 처음으로 실습해보려니 OpenAI Gym API 자체가 익숙하지 않았는데, 거기에 대한 설명도 첨부합니다.
마지막으로, OpenAI의 FrozenLake 환경으로 실습해 본 코드 링크입니다.