'구글 딥마인드'에 해당되는 글 1건

  1. 2016.03.12 알파고 키즈의 등장

알파고 키즈의 등장

Gos&Op 2016.03.12 10:30 |
Share           Pin It
(금요일에 생각한 것 위주로...) 어제 이세돌 9단과 알파고의 구글 딥마인드 챌런지 2차 대국이 끝난 후에는 나름 멘붕에 빠져 아무런 생각도 나지 않았는데, 자고 일어나서 다른 분들의 글을 읽으면서 여러 생각들이 막 떠오른다. 휴가를 내고 하루 종일 운전하면서 떠오른 생각을 정리하려 한다. 그냥 출근했더면 글을 적느라 아무 것도 못했을 것 같다.

알파고 키즈
역사적인 현장에는 늘 새로운 스타가 등장한다. 그러면 그를 모델로 삼은 새로운 세대가 등장하곤 한다. 최초의 메이저리거였던 박찬호나 맨체스터 유나이티드에서 당당히 레귤러 멤버로 확약한 박지성을 보고 자란 박찬호 키즈나 박지성 키즈가 있지만, 가장 대표적인 사례는 골프 여제 박세리를 보고 자라난 박세리 키즈가 있다. 이번 대국에서 아마도 바둑계에서는 이세돌 9단이 무난히 승리해서 국내에서 바둑 신드롬을 일으켜서 이세돌처럼 되기를 꿈꾸는 이세돌 키즈의 등장을 내심 기대했겠지만, 결과적으로 알파고의 영향을 받아서 인공지능이나 로봇공학에 관심을 가지고 연구하려는 세대가 등장할 것 같다. 이 세대의 사람들을 알파고 키즈라 부르면 될 것 같다. 이세돌 개인과 박둑계에는 안타까운 일이지만, 5년에서 10년 내로 알파고를 보고 인공지능을 만들고 싶었어요라고 말하는 연구자들이 나올라 것이고 — 인공지능이 디스토리아를 만들지 않는다면 — 인류 전체에는 분명 큰 전진을 위한 일보 후퇴였다. 당장 1~2년 안에 정부에서 인공지능 쪽으로 지원이 많이 늘어날 듯...

전략
좋은 전략이란 무엇인가?라는 질문을 던지게 된다. 듣기에 아주 그럴듯한 전략도, 과거에 성공했던 전략도, 또는 다수가 좋아하는 전략도 좋은 전략일 수가 있지만, 결국 좋은 전략은 이기는 전략이다라는 결론을 내린다. 아무리 참신한 전략이더라도 진다면 좋은 전략이 아니고, 마지막까지 승기를 잡은 전략이더라도 끝에 지면 좋은 전략이 아니다. 알파고가 어떤 전략과 전술을 사용했는지 모르겠으나 결국 이겼다. 알파고는 바둑을 둔 것이 아닐지는 몰라도, 최소한 이기는 전략을 펼쳤고, 이기기 위해서 최선을 다 했다.

춘래불사춘
인공지능에 대한 정의가 광범위하지만 적어도 인간과 같은 지능의 등장은 아직도 멀었다. 2패 직후에는 인간과 같은 지능의 등장이라는 생각에 힘이 빠졌지만 자세히 생각해보면 그 단계에 이르려면 아직 갈 길이 멀다. 특정 분야에서는 인간만이 할 수 있을 것같은 일들을 기계가 해내고 있지만 그건 그렇게 하도록 프로그래밍된 것에 불과하다. 프로그래밍됐다는 하드코딩됐다는 의미가 아니다. 알파고를 인공지능이라고 불러야할까?를 고민해봤지만, 어쩌면 아니다라고 말하는 것이 맞을 것 같다는 생각이다. 인간을 이긴 것은 맞지만 그렇다고 지능을 가졌다라고 말하는 것에는 무리가 있다는 얘기다.

딥블루가 체스 그랜드마스터를 이겼지만 그건 지능의 승리가 아니라 컴퓨팅 파워의 승리였다. 당시 최고의 슈퍼컴퓨터의 컴퓨팅 파워가 인간이 할 수 있는 것 이상을 처리해낸 것에 불과하다. 왓슨이 쿼즈 프로그램에서 이긴 것은 조금 더 발전한 건 맞다. 사회자의 목소리를 해석해서 맞는 답을 찾아냈기 때문에 그렇다. 그러나 결국 왓슨은 방대한 양의 정보의 승리에 더 가깝다. 언어 추론과 정답 매핑을 평가절하하는 것이 아니다. 만약 다른 사람들이 왓슨만큼의 정보를 가졌다면 버즈를 누르는 타이밍은 놓쳤을지라도 정답을 몰랐을 수는 없다. 만약 사람 얼굴 사진을 보여주고 누구냐?라는 퀴즈가 나왔다면 당시 왓슨은 대답하지 못했을 가능성이 있다. 그런데 지금의 알파고 (를 가능케한 ConvNet)는 가능하다. 그런 의미에선 지능이 발전했다.

알파고도 결국 컴퓨팅 파워, 즉 연산의 승리로 보인다. 알파고의 승리는 결국 (인간) 집단지성의 승리고, 그런 집단지성을 한데 모아서 패턴을 찾아낼 수 있게한지 컴퓨팅 파워와 아키텍쳐의 승리다. 결국 인간의 바둑을 모사한 것이지 엄밀히 말해서 바둑 규칙에서 전략을 스스로 만들어낸 것은 아니다. 그리고 딥블루 이후로 컴퓨팅 파워가 아주 발전했다는 것을 확인할 수가 있었고 또 분산처리 패러다임이 딥블루보다 진일보한 것이다. 결국 — 러프하게 말하면 — 알파고는 수많은 인간의 바둑 기보의 집합체에 불과하다고 볼 수도 있다. 물론 모든 기보를 가졌다고 알파고처럼 할 수 있다는 얘기는 아니다. 강화학습 — 정확히 표현하면 자기강화 self-reinforcement — 을 통해서 인간의 기보를 발전시킨 점에서 대단한 능력을 가진 것은 분명해 보인다. 추론컨대 사람의 기보 및 자기강화를 통한 학습은 대국의 극초반과 지협적인 전투만 국한해서 영향을 줬지, 중반 이후의 승기는 학습과는 좀 무관해 보인다. 경우의 수가 많을 때는 임의 시뮬레이션을 통해서 그리고 경우의 수가 충부히 줄어들었을 때는 풀스캔을 통해서 최고의 점수를 얻는 길을 그냥 선택한 것 뿐이다. (간단한 것처럼 적었지만 이게 어려우니 아직까지 등장하지 못했던 거긴 하다.)

체스나 바둑과 같은 전략 게임에서 새로운 전략을 스스로 세워서 경쟁하는 것이 아니라, 가능한 모든 시나리오 또는 (사실상 불가능하니) 임의의 시뮬레이션을 통해서 가장 좋은 수를 얻는다는 것은 스스로 생각하는 기계가 아니라 원래부터 컴퓨터가 가장 잘 하던 것 (빠른 연산)을 잘 수행한 것 그 이상이 아니다. (이걸 가능케한 연구진들에게는 박수와 찬사를 보낸다.) 봄이 왔지만 봄은 오지 않았다. 컴퓨터가 인간을 이기고 있지만 인공지능의 시대가 도래한 것은 아니다. 인공지능의 수준에 따라서 이견이 있겠으나, 적어도 기계가 인간을 지배하는 그런 류의 마치 인간처럼 또는 인간 이상으로 행동하는 그런 지능의 시대는 멀었다는 얘기다. 스카이넷은 잠시 잊어라.

사람과 컴퓨터
그동안 데이터 분석을 업으로 삼으면서 약간 모호함 (과 인간의 직관)을 중시하는 편이었다. 이전 글들에서 적었듯이 데이터와 알고리즘에서 나온 엄격함보다는 인간이 이해할 수 있는 또는 사람에게 설명할 수 있는 것을 추구하는 것이 필요했다. 경험과 감에 의해서 조절되는 것에 많은 의미를 뒀다. 그러나 이젠 사조가 바뀌어야할 것 같다. 사람이 이해를 못하더라도 모델과 데이터에서 얻은 것으로 끝까지 밀고 나가야할 것 같다. 알파고는 바둑에서 집 싸움을 하지 않았다. 그래도 이겼다. 사람을 이해시키기 위한 노력은 이젠 헛것이 된 것 같다. 몇 수 앞을 내다보는 것은 더이상 의미가 없다. 모든 수, 즉 마지막 수까지 내다보고 계산해서 현재의 가능성을 가장 높이는 것이 최적의 솔루션이 됐다. 분석 이후의 해석이 중요하다고 생각했지만, 이젠 해석이 필요없는 시대로 접어들었다. 그저 결과가 좋으면 그만이다. 더 촘촘하게 짜맞춰야 한다.

한계
이번 대국에서 놀라웠던 점이 있다. 원래 인간과 컴퓨터의 대결에서 후반부로 가면 인간이 절대 불리하다. 바둑의 경우의 수는 현재의 컴퓨터로는 아직 넘어설 수 없다. 그런데 한 수 한 수 진행되면서 종반으로 가면 컴퓨터가 감당할 수준의 경우의 수만 남는다. 바둑판이 361칸이라서 최소 200이나 250수가 넘어서면 풀스캔이 가능하다고 생각했는데, 생각보다 (사실상) 풀스캔이 이른 시점에 가능하다는 점이다. 100수 정도가 지난 중반부터는 사실상 풀스캔이 이뤄지고 그때부터는 기존에 충분한 영역을 확보해놓지 않으면 절대 컴퓨터를 이길 수 없다. 1200개의 CPU 클러스터가 생각보다 연산 능력이 뛰어났다. 그리고 경우의 수가 크다는 의미는 역설은 수가 진행될수록 경우의 수가 기하급수적으로 줄어든다는 점에 있다. 뿐만 아니라, 영역이 어느 정도 정해지면 (자신의 영역 및 남의 영역 모두) 그 부분은 고려 대상에서 제외시켜버리면 경우의 수가 매우 제한적이다. 361개의 가능한 포인트에서 이미 100수가 진행되었다면 100집 정도는 이미 안정적으로 구축돼서 파고들 여지가 없다. 그렇다면 이제 남은 150개 정도의 지점을 누가 가져가느냐의 싸움이 시작되는데, 이 수준에 이르렀을 때 사람들은 여전히 불확실하지만 컴퓨터는 그렇지 않다. 사실상 컴퓨터는 대국의 승패를 알고 있다. 이 순간부터 인간이 자칫 실수를 하면 인간의 완패다. 두번째 대국에서 이세돌 9단이 승기를 잃었던 시점도 이때부터였던 것같다. 현재까지 본 것을 결론을 지으면 극초반에 자신의 영역을 확실히 선언하고 중반으로 가면서 공통 영역인 중앙에서 밀리면 안 된다. 초반에 충분한 집을 확보해놓지 못하고 또 중반에 중앙에서 밀리면 그냥 끝이다.

(낮동안 많은 생각을 했지만 밤 늦게 글로 옮기면서 행간의 의미를 모두 끼워넣지 못한 점이 있습니다. 낮에 생각한 그대로 표현하지 못한 것도 있고…)

승패는 결국 중요하지 않다. 인간과 컴퓨터의 대결에서 승자와 패자가 아닌, 인간만이 할 수 있는 것을 묵묵히 해가고 있는 이세돌 9단을 끝까지 그리고 대국 이후에도 계속 응원합니다.

===
F: https://www.facebook.com/unexperienced

댓글을 달아 주세요