close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

2월 13일 세미나 진행 내용

cosmos 2018.02.13 11:56 조회 수 : 69

2월 13일 세미나에서 진행되는 내용들 정리입니다.

 

1. 김성훈 교수님 강화학습 - 조아라님

  - https://github.com/modulabs/RL4RWS/tree/master/reinforcement-learning/04_qlearning_on_nondeterministic_env.py

  - https://hunkim.github.io/ml/RL/rl05.pdf

  - https://hunkim.github.io/ml/RL/rl-l05.pdf

  - 모두연 게시판에 Fronzenlake 실습를 올려 놓았습니다. 참고하시기 바랍니다. 


2. 김성훈 교수님 딥러닝    - 윤승제님

  - https://hunkim.github.io/ml/lec7.pdf

 

3. 강화학습 이론 - 시간을 고려하여 생략 가능

  - 이산 시간 확률 과정, 마르코드 체인, 마르코프 의사결정 과정

  - http://www.modulabs.co.kr/board_tHkR10/17852

 

4. 매트랩 설치 관련 토의


5. 아두이노 초음파센서 테스트

  - 아두이노 기반 초음파센서 테스트

    Slack에 올려 놓은 문서 참조

 

6. 역할 정리

   - 일정정리 완료

   - 역할에 대하여 협의를 했으면 좋겠습니다.

     http://www.modulabs.co.kr/RL4RWS/18664

 

7. 번역 문서

   - slack에 2차로 번역문서 올려놓았습니다. 오류나 수정 사항에 대하여 알려주세요.

 

- 다음 주 부터는 DQN에 적용된 Tensorflow 실습을 진행할 예정입니다.

- 올려놓은 Frozenlake 실습을  DQN에 적용해 보고 DQN 이후 강화학습 알고리즘도 계속해서 Fronzenlake에 적용할 예정입니다.