강화학습 공부를 하면서 몬테카를로 트리 탐색에 대해 알게되어 검색해보니 Decision making 알고리즘 중 하나.
몬테카를로 트리 탐색 : 의사결정을 하기위한 탐색 알고리즘.
어떻게 움직이는 것이 가장 좋은지 분석하면서 random sampling을 해서 search tree를 확장해나간다.
몬테카를로 트리 탐색은 매번 네 단계를 거친다.
1. selection
2. expansion
3. simulation
4. backpropagation
selection
루트 노드에서 시작해서 자식 노드를 선택하면서 내려가서 리프 노드에 다다른다. 가장 승산있는 수로 확장시킬 자식 노드를 선택한다.
expansion
리프 노드에서 게임이 종료된다면 하나 이상의 자식 노드를 생성하고 그 중 하나의 노드 C를 선택한다.
Simultion
확장을 통해 선택한 C로부터 랜덤 플레이아웃을 실행한다.
Backpropagation
플레이아웃의 결과로 C 노드부터 루트 노드까지의 노드 정보를 갱신한다.
참고자료
'Machine Learning' 카테고리의 다른 글
Scikit-learn Datasets 관련 정리 (0) | 2020.02.14 |
---|---|
선형(Linear)에 대한 이해 (0) | 2019.11.23 |
PyTorch - What is PyTorch (1) (0) | 2019.10.16 |
Keras - ImageDataGenerator (0) | 2019.10.16 |
코세라 - 04 Multiple features (0) | 2019.08.30 |