close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

 

9월 1일

발표자: 최한철님

Asynchronous Methods for Deep Reinforcement Learning

https://arxiv.org/abs/1602.01783

 

9월 8일

발표자: 추광재님

Model-Free Episodic Control

https://arxiv.org/abs/1606.04460

 

9월 15일 (추석)

 

 

9월 22일

발표자: 이영무님

Deterministic Policy Gradient Algorithm

http://jmlr.org/proceedings/papers/v32/silver14.pdf

 

9월 29일

발표자: 김선훈님

SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient

https://arxiv.org/abs/1609.05473