알파고1 알파고와 외국어 학습법 알파고가 어떻게 바둑을 deep learning 하는가에 대해서 잘은 모르지만, 대강 이렇다고 한다. 1. 수많은 과거 데이터(기보)를 보고 어떤 식으로 움직여야 하는지, 어떻게 하면 유리해 질 확률이 높아지는지에 대한 게임의 룰을 파악하는 policy network라는 알고리듬과 2. 바둑을 두는 상황에서 각 국면에 대해 자신과 상대의 수가 각각 얼마나 유리한지를 평가하는 value network라는 알고리듬을 가지고 이 둘을 계속 상호작용 시키면서 한 수 한 수를 두어 나가고, 또 이것을 하나의 케이스화하여 데이터베이스로 축적해 나간다고 한다. 여기서 중요한 건, 알파고가 바둑 룰에 근거한 모든 경우의 수를 따져서 결과를 미리 다 보고 바둑을 두는게 아니라는 점이다. 알파고는 수많은 노이즈 속에서 '.. 2019. 9. 25. 이전 1 다음