인공지능 알파고를 완성하는 딥 러닝, 그리고 엔비디아 GPU

2016-03-09     정환용 기자

바둑 기사 이세돌 9단과 인공지능 알파고의 대국이 관심을 집중시키고 있는 가운데, 딥 러닝, GPU 등 알파고의 지능을 구현하는 첨단 기술들에 대한 세간의 관심도 높아지고 있다.

구글 딥마인드의 인공지능 소프트웨어 ‘알파고’(AlphaGo)는 사람의 신경구조를 모방한 인공신경망에 기초해 스스로 학습하고 판단하는 딥 러닝 알고리즘을 기반으로 작동한다. 일정 양의 예상 수순 또는 지식을 짜 맞춰 프로그램화 해놓는 방식이 아닌, 반복학습(경험)을 통해 데이터에 내재된 다양한 특징이나 행동의 확률적 빈도를 분석하고 학습한다.

알파고는 딥 러닝 알고리즘을 바탕으로 3,000만 건이 넘는 프로기사들의 대국 정보를 스스로 학습하며 최선의 수를 터득하고 있다. 이는 사람의 학습 속도에 대입할 경우 약 1,000년 간 바둑에 매진한 것과 맞먹는 분량이다. 방대한 양의 데이터를 처리하기 위해 알파고는 거대한 네트워크로 연결된 분산 시스템을 통해 다수의 CPU 및 엔비디아 GPU 프로세서들을 활용한다.

특히 엔비디아의 GPU 기술은 대량의 딥 러닝 데이터를 소화하는 것은 물론, 10의 170제곱에 달하는 바둑의 경우의 수를 예측하는 엄청난 규모의 연산을 빠르고 정확하게 처리할 수 있는 병렬 컴퓨팅 성능을 제공한다. 멀티 코어 기반의 GPU는 다중 연산, 특히 숫자나 알고리즘을 처리할 때 순차 연산에 특화된 CPU 대비 월등히 높은 성능을 나타내며, 이를 통해 구축비용과 전력 소모 역시 획기적으로 낮출 수 있다.

알파고는 딥 러닝 알고리즘 및 GPU 기술을 바탕으로 ‘강화 학습’을 끊임없이 진행한다는 점에서 기존의 인공지능과 차별화된다. 알파고가 어떤 판단을 내린 뒤, 그 판단이 바람직하면 가중치를 책정하며 계속해서 스스로 강화하는 방식이다. 알파고의 강화 학습은 이번 대국을 관전하는데 있어서도 주요 관전 포인트가 될 것으로 많은 이들이 전망하고 있다. 알파고가 초반 승기를 잡지 못한다 해도, 대국을 치를 때마다 강화학습을 통해 업그레이드되며 4번째, 5번째 대국에서는 얼마나 달라진 기력을 선보일지 기대를 모으고 있다.

한편, 알파고는 자체 신경망끼리 수천만 번의 바둑을 거치면서 경험한 시행착오를 기반으로 강화학습 실시, 빠른 속도로 기력을 향상시키며 지난해 10월 유럽의 바둑 챔피언인 판 후이와의 대국에서 5전 전승을 기록한 바 있다. 이세돌 9단과 알파고의 이번 대국은 오늘부터 15일까지 서울 포시즌스 호텔에서 열릴 예정이다.