close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

2016.07.07 강화학습 스터디 회의록

2016.07.07 22:04

이웅원 조회 수:120 추천:1

2016.07.07

 

DQN 첫번째 시간

 

1. 머신러닝이란

   - supervised learning

   - unsupervised learning

   - reinforcement learning

   ** 문제 : 학습데이터와 실재 데이터가 다를 수 있다. 학습데이터가 실재데이터의 내용을 반영하고 있어야한다. 근본적인 해결방법이 없다.

        " generalization 문제"

 

2. deep q learning

   https://www.youtube.com/watch?v=suNNrEHDR-I

 

 

다음주 : 추광재연구원님이 DQN코드를 카톡에 올려주시면 다같이 코드를 보고와서

             코드리뷰를 할 것

 

다다음주 : policy gradient를 볼 것

 

고민할 것 : 단순히 게임 플레이가 아닌 실재로 강화학습을 적용시킬 대상에 대해서 고민해볼 것