알파고 2.0, 기보도 없이 스스로 배우고 실력쌓아

  • 김미지
  • |
  • 입력 2017-05-25 07:50  |  수정 2017-05-25 07:50  |  발행일 2017-05-25 제19면
■ 세계 최강 커제9단 꺾은 알파고 2.0 어떻게 달라졌나
20170525
구글의 인공지능 바둑 프로그램 ‘알파고’와 세계 최강의 바둑기사 커제 9단이 23일 중국 저장성에서 대국을 펼치고 있다. 연합뉴스

지난해 3월 ‘구글 딥마인드 챌린지’를 통해 진행된 이세돌 9단과 알파고의 바둑대결이 너무 강렬해서일까. 23일 중국 저장성 우전에서 펼쳐진 ‘바둑의 미래 서밋’ 3번기 1차전에서 만난 커제 9단과 알파고 2.0의 대결에 대한 관심은 예전과 달랐다.

이세돌 9단과의 대결에선 ‘인공지능이 과연 인간을 따라잡을 수 있을까’에 관심이 쏠렸다. 다섯차례 대국이 진행되는 일주일 내내 전세계의 주목을 받았고, 경기는 매체와 인터넷으로 생중계됐다. 결과는 4대 1로 알파고의 승리였다.

‘세기의 대결’ 이후, 다음 알파고의 상대는 알파고가 자신을 이길 수 없을 것이라 호언장담했던 중국의 커제 9단이 됐다. 그의 자신감과 달리 IT업계 전문가들은 알파고의 승리를 내다봤다. 이세돌 9단과의 대결 이후, 알파고는 ‘알파고2.0’으로 불리며 많은 부분에서 개선됐다. 최근 온라인 바둑 사이트에서 유명 바둑기사들과의 대결에서도 60전 60승을 거둔 것도 알파고2.0이었다.

따라서 자연스레 이번 대결에선 ‘알파고가 얼마나 성장했을까’에 초점이 맞춰졌다. 이번 대국에서 알파고는 커제 9단에게 289수 만에 백 1집반 승을 거뒀다.

◆대결의 역사

인간과 인공지능이 대결을 펼친 것은 이세돌 9단과의 경기가 처음은 아니다.

IBM의 인공지능 체스컴퓨터 ‘딥블루(Deep Blue)’는 1997년 체스 세계 챔피언인 가리 카스파로프와 대결을 펼친 적이 있다. 딥블루는 1985년 미국 카네기멜론대가 개발한 ‘딥소트(Deep Thought)’를 바탕으로 만들어졌다. 딥블루는 이 대결에서 3승3무로 승리했다. 체스는 경우의 수는 많지만 규칙과 목표는 단순한 게임이라, 컴퓨터의 계산능력엔 최적의 분야다. 인공지능은 여기서 그치지 않고 인간이 사용하는 자연어를 처리하고 데이터를 분석·학습하는 인지 컴퓨팅 시스템을 갖추기 시작했다. IBM의 대화형 인공지능 프로그램 ‘왓슨’은 2011년 미국의 유명한 TV 퀴즈쇼 ‘제퍼디’에 출전했다. 왓슨은 상금을 가장 많이 받은 사람과 74회 연속 우승을 기록한 사람 등 역대 최고의 출연자와 대결을 펼쳤고 마지막까지 선두자리를 지켰다.


핵심연산 성능 30∼80배 향상
유명 기사들과 대결 60전 60승
기존과 달리 추론과 동시 학습
커제9단 “약점 보이지 않았다”



이후 구글 딥마인드가 개발한 알파고는 이세돌 9단과의 바둑대결에서 승리했다. 바둑에서 가장 중요한 기술은 ‘수읽기’다. 수읽기란 상대방이 둔 수의 의미를 분석하고 자신의 대응방법을 찾아 앞으로 일어날 변화를 추론하는 것이다. 인공지능은 딥러닝과 머신러닝 기술로 인간의 수읽기를 빠르게 습득하고 이를 대결에서 사용할 정도로 발전한 것이다.

◆강력해진 알파고2.0

알파고2.0과의 대결이 끝난 후 열린 기자회견에서 커제 9단은 “현재로선 알파고의 약점이 보이지 않는다”며 “졌지만 화는 나지 않는다”고 말했다. 데미스 하사비스 구글 딥마인드 CEO는 “이세돌 9단과의 대결에서 알파고의 바둑은 인간의 것에 가까웠으나, 지금은 갈수록 ‘바둑의 신’에 가까워진 것 같은 느낌을 받았다”고 했다. 알파고2.0이 이처럼 강력해진 원인은 TPU(Tensor Processing Unit) 때문이다. 핵심 연산을 담당하는 부분에 변화를 준 것이다. 중앙처리장치(CPU)와 그래픽처리장치(GPU)는 인공지능 분야에서 일반적으로 사용되고 있다. 기존 알파고도 CPU와 GPU를 사용했다.

구글이 직접 개발한 TPU는 인공지능 전용으로 설계된 것으로 알려졌다. 구글 측은 주 기능을 인공지능 연산과 예측에만 집중해 효율을 높여 TPU의 연산 성능이 최신 CPU보다 30~80배 높다고 설명했다.

기존의 알파고가 학습한 내용을 토대로 추론했다면 알파고2.0은 추론과 동시에 학습할 수 있다. 또 알파고2.0은 TPU를 탑재해 학습에 필요한 시간을 기존 3개월에서 1개월로 줄였다.

알파고2.0은 학습방법에서도 기존 알파고와 차이가 있다. 기존 알파고는 10만 여개의 바둑 기보를 학습하고 자기 자신과 수많은 대결을 했다. 반면 알파고2.0은 기존의 바둑 기보 없이 스스로 배우고 실력을 쌓았다. 기존 알파고가 고수들의 수를 모방하는 정도였다면 알파고2.0은 스스로 바둑의 형세를 분석하고 판단하는 수준에 들어섰으며 그로 인해 정확성이 높아졌다.

알파고2.0은 이번 바둑의 미래 서밋의 일환으로 26일 페어전과 단체전을 펼친다. 페어전은 ‘구리 9단-알파고 팀’과 ‘렌샤오 8단-알파고 팀’이 맞붙는다. 인간과 알파고가 번갈아 가며 바둑을 두는 경기다. 단체전은 중국의 정상급 바둑기사 5명이 한 팀으로 서로 상의하며 알파고와 맞서는 상담기다. 상담기는 별도의 바둑판에서 돌을 두며 수를 연구할 수 있다. 기사가 머릿속으로 수읽기 하는 것보다 좋은 수를 찾을 수 있다. 알파고가 단체전에서 예상을 뛰어넘는 어떤 새로운 수를 선보일지 주목된다.

김미지기자 miji4695@yeongnam.com

영남일보(www.yeongnam.com), 무단전재 및 수집, 재배포금지

경제인기뉴스

영남일보TV





영남일보TV

더보기




많이 본 뉴스

  • 최신
  • 주간
  • 월간