강화학습 공부를 하면서 몬테카를로 트리 탐색에 대해 알게되어 검색해보니 Decision making 알고리즘 중 하나. 몬테카를로 트리 탐색 : 의사결정을 하기위한 탐색 알고리즘. 어떻게 움직이는 것이 가장 좋은지 분석하면서 random sampling을 해서 search tree를 확장해나간다. 몬테카를로 트리 탐색은 매번 네 단계를 거친다. 1. selection 2. expansion 3. simulation 4. backpropagation selection 루트 노드에서 시작해서 자식 노드를 선택하면서 내려가서 리프 노드에 다다른다. 가장 승산있는 수로 확장시킬 자식 노드를 선택한다. expansion 리프 노드에서 게임이 종료된다면 하나 이상의 자식 노드를 생성하고 그 중 하나의 노드 C를 선..