9일 5번기 1국. 백을 쥔 알파고가 90수에서 프로 9단들이 보기엔 명백한 ‘실수’를 했다. 이세돌 9단의 얼굴 표정이 밝아졌다. 이어진 알파고의 102번째 수. 이 9단이 입을 벌렸다. 이 9단에게 유리했던 1국의 전세는 역전됐다. 결국 알파고의 불계승이었다. 기자 간담회에 나타난 이 9단은 백 102번째 수가 알파고의 ‘승부수’였다고 평가했다.

딥마인드가 바둑 기계를 개발하기 시작한 것은 2014년. 불과 두 살도 안 된 알파고가 유럽의 프로2단 판 후이를 제치고 이제 세계 최고수까지 넘본다. 알파고의 학습과 성장의 비결은 무엇일까. 알파고는 바둑의 묘수를 어떻게 찾아내는 것일까. 이 비밀을 알려면, 알파고의 학습과정과 착수과정을 알아야 한다.

딥러닝을 활용한 알파고의 학습 과정

먼저 알파고의 학습 과정, 즉 기계 학습 과정을 알아보자. 알파고는 여러 개의 인공신경망을 활용해서 배우는 기계학습법 ‘딥러닝(deep learning)’을 통해 바둑을 배웠다. 딥러닝은 통계적으로 접근해 확률을 계산하는 다른 기계 학습법과 달리 인간 뇌의 구조를 모방한 인공신경망으로 학습한다. 인간의 신경망은 새 데이터가 들어오면 여러 개의 신경망 연결구조가 ..

이코노미조선 멤버십 기사입니다
커버스토리를 제외한 모든 이코노미조선 기사는
발행일자 기준 차주 월요일 낮 12시에
무료로 공개됩니다.
멤버십 회원이신가요? 로그인