close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

Sutton 교수님 책의 Chapter 4. Dynamic Programming을 보고 노트로 정리해 봤습니다.

 

강화학습 쪽은 워낙 정리된 자료가 많아서 개인 공부를 위해 필기로만 정리해봤습니다.

 

개인적으로 Silver 교수님의 동영상 강의는 영어가 부족해서 그런지 약간 지루하고,

 

이웅원 님 책으로 대충 보고 Sutton 교수님 책을 보니 디테일까지 이해가 되네요.

 

이론 정리 노트와 OpenAI Gym 으로 처음으로 실습해보려니 OpenAI Gym API 자체가 익숙하지 않았는데, 거기에 대한 설명도 첨부합니다.

 

마지막으로, OpenAI의 FrozenLake 환경으로 실습해 본 코드 링크입니다.

 

https://github.com/elton-choi/rl-tutorial

번호 제목 글쓴이 날짜 조회 수
공지 강남 Dynamics 연구실 모임 안내 모두의연구소 2016.08.08 2359
110 [논문 리뷰] Raibert, trot, pace, bounding file 최한철 2019.07.30 100
109 4족 보행 프로젝트 1차 - 자료 모음 최한철 2019.07.04 378
108 Balancing for torque controlled humanoid robots_Part4 file 김경민 2019.05.11 109
107 Balancing for torque controlled humanoid robots_Part3 file 김경민 2019.05.03 73
106 [논문 리뷰] Friction Observer with Joint Torque Sensor file 최한철 2019.05.02 154
105 Balancing for torque controlled humanoid robots_Part2 file 김경민 2019.04.27 63
104 [논문 리뷰] Collision Detection Survey file 최한철 2019.04.22 88
103 Floating base robot dynamics file 김경민 2019.04.20 78
102 Balancing for torque controlled humanoid robots_Part1 file 김경민 2019.03.29 123
101 redundancy analysis of cooperative dual arm manipulators_part2 file 김경민 2019.03.23 81
100 [강화학습 스터디] Q-learning with table in frozen lake 최한철 2019.03.22 203
99 redundancy anlaysis of cooperative dual arm manipulators_part1 file 김경민 2019.03.15 65
98 [강화학습 스터디] Silver, Ch.4. Model-free prediction 정리 file 최한철 2019.03.10 102
97 Balancing of humanoid robot based on position control_Part2 file 김경민 2019.03.08 53
96 Balancing of humanoid robot based on position control_Part1 file 김경민 2019.02.23 100
95 Whole body controller(adative tdc+multiple tasks)_Part2 file 김경민 2019.02.16 72
94 Whole body controller(adative tdc+multiple tasks)_Part1 file 김경민 2019.02.08 93
» [강화학습 스터디] Dynamic Programming 정리 file 최한철 2019.02.08 255
92 Dual manipulator(admittance) Part2 file 김경민 2019.01.25 90
91 Dual manipulator(admittance) Part1 file 김경민 2019.01.18 124