close_btn
로그인, 회원가입후 더 많은 혜택을 누리세요 로그인 회원가입 닫기

Monte-Carlo Tree Search 코드

2016.10.06 23:14

이영무 조회 수:1640 추천:5

오늘 알파고 논문 본 김에 예전에 작성했던.. (어디서 베껴왔던...) 코드 공유합니다.

혹시 관심있으실 분들도 있을 것 같아서요!!

 

TicTacToe 게임에 MCTS를 적용한 파이썬 코드입니다.

사람과 게임을 하는 방식으로 되어있습니다.

 

pure MCTS는 아니고, UCT(Upper Confidence bound applied to Trees)알고리즘입니다.

 

혹시 이 참에 upper confidence bound에 대해 잘 아시는 연구원분께서는

좀 알려주시면 감사하겠습니다!!

번호 제목 글쓴이 날짜 조회 수
공지 강화학습 (Reinforcement Learning) 연구실 OpenRL 모임 안내 모두의연구소 2016.06.12 1127
22 softmax action result에 대한 reward 김상범 2017.10.31 210
21 강화학습 논문 웹사이트 모음 xelgana 2016.10.28 1290
» Monte-Carlo Tree Search 코드 [3] file 이영무 2016.10.06 1640
19 2016. 9. 1. Asynchronous 발표 자료 [1] file 최한철 2016.09.10 385
18 2016. 9. 1. 발표자료 [3] 최한철 2016.08.29 376
17 Fundamental of Reinforcement Learning 링크 이웅원 2016.08.24 1001
16 2016.08.18 OpenRL 발표자료 file 이웅원 2016.08.17 713
15 강화학습 그리고 OpenAI - 4: CartPole with Policy Gradient (2) Code Review [5] file 이웅원 2016.07.20 4569
14 강화학습 그리고 OpenAI - 4: CartPole with Policy Gradient (1) Policy Gradient [9] file 이웅원 2016.07.15 8797
13 강화학습 그리고 OpenAI - 3: CartPole with Deep Q Learning (4) Code Review file 이웅원 2016.07.14 7352
12 강화학습 그리고 OpenAI - 3: CartPole with Deep Q Learning (3) TensorFlow 이웅원 2016.07.13 3563
11 강화학습 그리고 OpenAI - 3: CartPole with Deep Q Learning (2) DQN file 이웅원 2016.07.13 5237
10 강화학습 그리고 OpenAI - 3: CartPole with Deep Q Learning (1) CartPole example file 이웅원 2016.07.12 5708
9 DQN 발표자료 file 플룻 2016.07.11 871
8 강화학습 그리고 OpenAI - 2: Intro to Reinforcement Learning (2) Q Learning [4] file 이웅원 2016.07.08 13713
7 강화학습 그리고 OpenAI - 2: Intro to Reinforcement Learning (1) MDP &Value Function [2] file 이웅원 2016.07.04 15354
6 강화학습 그리고 OpenAI - 1: Introduction to OpenAI [3] file 이웅원 2016.07.01 18084
5 Reinforcement Learning by Sutton Chapter 5~16 file 마르코프김 2016.07.01 520
4 Reinforcement Learning by Sutton Chapter 1~4 [1] file 마르코프김 2016.06.30 1988