close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

2월 13일 세미나 진행 내용

cosmos 2018.02.13 11:56 조회 수 : 42

2월 13일 세미나에서 진행되는 내용들 정리입니다.

 

1. 김성훈 교수님 강화학습 - 조아라님

  - https://github.com/modulabs/RL4RWS/tree/master/reinforcement-learning/04_qlearning_on_nondeterministic_env.py

  - https://hunkim.github.io/ml/RL/rl05.pdf

  - https://hunkim.github.io/ml/RL/rl-l05.pdf

  - 모두연 게시판에 Fronzenlake 실습를 올려 놓았습니다. 참고하시기 바랍니다. 


2. 김성훈 교수님 딥러닝    - 윤승제님

  - https://hunkim.github.io/ml/lec7.pdf

 

3. 강화학습 이론 - 시간을 고려하여 생략 가능

  - 이산 시간 확률 과정, 마르코드 체인, 마르코프 의사결정 과정

  - http://www.modulabs.co.kr/board_tHkR10/17852

 

4. 매트랩 설치 관련 토의


5. 아두이노 초음파센서 테스트

  - 아두이노 기반 초음파센서 테스트

    Slack에 올려 놓은 문서 참조

 

6. 역할 정리

   - 일정정리 완료

   - 역할에 대하여 협의를 했으면 좋겠습니다.

     http://www.modulabs.co.kr/RL4RWS/18664

 

7. 번역 문서

   - slack에 2차로 번역문서 올려놓았습니다. 오류나 수정 사항에 대하여 알려주세요.

 

- 다음 주 부터는 DQN에 적용된 Tensorflow 실습을 진행할 예정입니다.

- 올려놓은 Frozenlake 실습을  DQN에 적용해 보고 DQN 이후 강화학습 알고리즘도 계속해서 Fronzenlake에 적용할 예정입니다.

 

번호 제목 글쓴이 날짜 조회 수
공지 RL4RWS 이용 안내 모두의연구소 2017.09.04 1490
39 2월 20일 세미나 진행 내용 cosmos 2018.02.20 47
38 [아두이노] 초음파 센서 연결 예제 [2] file 쪼알 2018.02.16 35
» 2월 13일 세미나 진행 내용 cosmos 2018.02.13 42
36 강화학습 실습 7. FrozonLake : Q-network cosmos 2018.02.11 23
35 강화학습 실습 6. Tensorflow 설치 및 간단한 테스트 cosmos 2018.02.11 44
34 강화학습 실습 5. FrozonLake - Q-Learning on Stochastic World cosmos 2018.02.09 22
33 강화학습 실습 4. FrozonLake - Q-Learning : Exploit & Exploration cosmos 2018.02.09 17
32 강화학습 실습 3. FrozonLake - dummy Q-learning cosmos 2018.02.09 30
31 강화학습 실습 2. FrozonLake 동작 시켜 보기 cosmos 2018.02.09 36
30 강화학습 실습 1. Python과 OpenAI Gym 설치 및 간단한 동작 cosmos 2018.02.09 61
29 1차 아두이노 및 부품 리스트 file cosmos 2018.02.07 47
28 2월 6일 세미나 진행 내용 cosmos 2018.02.06 53
27 아두이노 기반 실물 제작 발표자료 file cosmos 2018.02.02 43
26 아두이노 설치 및 초음파센서, 모터, 블루투스 예제 사이트 정리 cosmos 2018.02.01 54
25 향후 일정 정리 file cosmos 2018.01.31 108
24 1월 30일 세미나 진행 내용 cosmos 2018.01.31 21
23 강화학습의 진화 : 3차원 및 물리환경의 적용 - LG blog file cosmos 2018.01.26 65
22 1월 23일 세미나 진행 내용 cosmos 2018.01.23 67
21 Autonomous self-learning systems 영문 번역 1차 file cosmos 2018.01.22 54
20 이산 시간 확률 과정, 마르코프 체인, 마르코프 의사결정 과정 관련 사이트 정리 cosmos 2018.01.18 165