close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

Sutton 교수님 책의 Chapter 4. Dynamic Programming을 보고 노트로 정리해 봤습니다.

 

강화학습 쪽은 워낙 정리된 자료가 많아서 개인 공부를 위해 필기로만 정리해봤습니다.

 

개인적으로 Silver 교수님의 동영상 강의는 영어가 부족해서 그런지 약간 지루하고,

 

이웅원 님 책으로 대충 보고 Sutton 교수님 책을 보니 디테일까지 이해가 되네요.

 

이론 정리 노트와 OpenAI Gym 으로 처음으로 실습해보려니 OpenAI Gym API 자체가 익숙하지 않았는데, 거기에 대한 설명도 첨부합니다.

 

마지막으로, OpenAI의 FrozenLake 환경으로 실습해 본 코드 링크입니다.

 

https://github.com/elton-choi/rl-tutorial

번호 제목 글쓴이 날짜 조회 수
공지 강남 Dynamics 연구실 모임 안내 모두의연구소 2016.08.08 1946
95 Whole body controller(adative tdc+multiple tasks)_Part2 file 김경민 2019.02.16 6
94 Whole body controller(adative tdc+multiple tasks)_Part1 file 김경민 2019.02.08 24
» [강화학습 스터디] Dynamic Programming 정리 file 최한철 2019.02.08 80
92 Dual manipulator(admittance) Part2 file 김경민 2019.01.25 46
91 Dual manipulator(admittance) Part1 file 김경민 2019.01.18 62
90 Task Transition file 김경민 2019.01.13 40
89 Anaconda, OpenAI 설치 최한철 2019.01.11 100
88 Redundant Manipulators - part2 file 김경민 2019.01.05 42
87 [논문 리뷰] Unified force/impedance controller file 최한철 2019.01.01 97
86 질문이 하나 있어 여기에 올려봅니다. [5] file 헬멧 2018.12.17 180
85 2018 모두콘 발표자료 file 최한철 2018.12.16 214
84 Redundant Manipulators - part1 file 김경민 2018.12.14 64
83 H infinity(Manipulator) 발표자료 file 김경민 2018.12.07 120
82 로봇 제어 시뮬레이터 구축 (V-rep, Matlab 연동) file 김경민 2018.12.01 317
81 H infinity(Euler lagrange system) part4 정리노트 file 김경민 2018.11.16 81
80 H infinity(Euler lagrange system) part3 정리노트 file 김경민 2018.11.10 59
79 Slotine, Adaptive Control of Manipulator 논문 리뷰 file 최한철 2018.11.04 81
78 H infinity(Euler lagrange system) part2 정리노트 file 김경민 2018.11.02 62
77 H infinity(Euler lagrange system) part1 정리노트 file 김경민 2018.10.27 75
76 H infinity(Linear system) part2 정리노트 file 김경민 2018.10.27 41