알파고 제로, 알파고의 진화는 어디까지일까

목차

    2017. 10. 23. 20:05

    알파고 제로가 나오면서

    다시 한 번 세상이 놀랐습니다.

    16년 3월 알파고가 이세돌을 4:1로

    승리한 이후 지속적으로 발전해 온

    알파고인데요.

    당시에 사람들이 충격 받으며

    이세돌이 알파고를 이긴

    유일한 사람이 되는 것이 아니냐는

    애기가 있었는데

    이제 현실이 되는 것 같습니다.


    알파고 Zero는 무엇일까요?

    알파고 Zero는

    이번에 새로 태어난 알파고 버전입니다.

    알파고는 여러 개의 버전이 있는데요.

    Fan, Lee, Master 그리고 이번에 나온 Zero가 있습니다.

    이세돌을 격파한 것이 알파고 Lee이고,

    이후 세계 바둑 1위인 커제를 3:0으로

    완승한 것이 Master입니다.

    Zero는 이 두 알파고 버전을

    압도적인 차이로 이겼다고 하니

    놀라지 않을 수 없습니다.


    알파고 Zero는 왜 이슈가 되었을까요?

    알파고 Zero가 이슈가 되는 이유는

    경기결과로 보여주는 실력도 있겠지만,

    기존 알파고와 다르게

    학습 데이터 없이 바둑 규칙으로

    엄청난 실력을 갖추었다는 데 있습니다.

    알파고Lee는 16만개의 기보를 학습한 결과를

    토대로 바둑을 두었다면,

    알파고 Zero는 강화학습을 통해

    학습 데이터 없이 바둑을 두었다고 합니다.

    강화학습은 행동의 결과에 대해

    이익과 손해를 주어 학습시키는 방법입니다.



    알파고 Zero는 어떻게 만들어졌을까요?

    (벽돌 부수기 게임)


    저는 옛날 게임 중에

    '벽돌 부수기'라는 게임으로

    설명하는 예가 가장 와 닿았습니다.

    간단하게는 공이 오는 것에 따라

    좌우로 움직이면서 공을 받아내는 게임인데요.

    특정 상황에 공이 좌로 움직였을 때

    공을 받아내지 못했다면 마이너스 값을 주고,

    공을 받아냈을 때는 플러스 값을 주는 방식으로

    특정 상황에서 어떻게 움직이는 것이

    공을 받아낼 확률이 높은지

    게임을 플레이 하면서 학습을 해 나가는

    방식입니다.


    알파고 제로에 대해

    좀 더 자세한 정보를 알고 싶으시다면

    아래 글을 참조하시는 게 많은 도움이 되실 것입니다.

    ( 참조: 알파고는 스스로 신의 경지에 올랐다 )


    글을 읽다가 보시면 elo rating 이야기가 나오는데

    관련된 제 이전 글을 첨부해 봅니다.

    ( 참조: 

    2017/08/11 - [경마로 데이터 분석 재밌게 배우기/3. 데이터 분석] - #2-4 나만의 레이팅 시스템 만들기(elo rating) )



    알파고가 이세돌을 이겼을 때,

    거기가 끝일 줄 알았지만

    빠른 시간에 계속해서 진화해가는 모습은

    정말 신기하네요.

    스타크래프트도 도전중이라고 하는데

    어떤 경기력과 사람들이 상상하지 못하는 수를

    보여줄 지 기대가 됩니다.


    (스타크래프트2 API 공개소식, 2017.8.11, 인공지능을 이용하여 실험할 수 있다고 한다.)


    알파고가 바둑을 이기기 전에는

    바둑은 인간만이 할 수 있는

    고도의 지적 영역으로 생각되었는데요.

    기계가 이렇게 압도적인 실력을

    가질 수 있는 것을 증명해 나가니

    안타까움과 아쉬움이 남습니다.

    그 전에는 바둑 실력도 중요하지만

    기세와 분위기, 승부의 흐름 등도

    중요한 요소였습니다.

    인간이 해 낼 수 있는 영역의 낭만이

    점점 사라지는 것 같습니다.