“일반인한테 인공지능이 블랙박스로 남으면 안돼"
9월 14일부터 이틀간 일정으로 서울에서 열리는 국내 최대 테크놀러지 콘퍼런스 ‘스마트클라우드쇼 2017’에 ‘마스터 알고리즘’의 저자 페드로 도밍고스(Pedro Domingos)가 온다. 마스터 알고리즘은 빌 게이츠 마이크로소프트(MS)가 꼭 읽어야 할 책으로 꼽은 책이다. 도밍고스는 누구이며 마스터 알고리즘은 어떤 책일까. 인공지능과 더불어 살아가는 세상은 유토피아일까, 디스토피아일까.
도밍고스는 머신러닝에 대한 호기심을 충족하기 위한 안내자가 될 수도 있고, 통합을 원하는 전문가를 위한 조언자가 될 수도 있다. 지금 머신러닝을 어디에서부터 시작해야 할지 모른다면 도밍고스의 여행을 따라 가보는 것은 충분한 의미가 있다. 왜냐하면 당신을 위협과 불안 가득한 회색지대에 방치하는 것이 아니라, 희망과 새로운 가능성으로 이끄는 관문으로 안내할 것이기 때문이다.
▲페드로 도밍고스 워싱턴대 교수(왼쪽)와 에릭 슈미트 전 구글 회장/페드로 도밍고스 트위터
◆ 페드로 도밍고스는 누구?
도밍고스는 미국 워싱턴대학의 컴퓨터 과학 및 공학부 교수이다. 포르투갈 리스본기술대(IST)에서 전기공학 및 컴퓨터과학 학사와 석사 학위를, 캘리포니아 대학 어바인 캠퍼스에서 박사 학위를 취득했다. 대학교 4학년 때, ‘인공지능’이라는 책을 서점에서 발견한 이후 20년이 넘는 세월 동안 머신러닝을 연구했다. 그는 “당시에는 전망이 불투명한 분야였지만, 머신러닝이 인공지능의 과제를 해결하는 핵심이라는 생각에 이 분야를 선택했다”고 회고한다. 그는 데이터 과학 분야의 최고 영예인 SIGKDD 혁신상을 2년 연속 수상했다.
도밍고스는 오늘날 가장 주목받고 있는 인공지능이 일반인에게 블랙박스로 남아 있으면 안된다고 주장한다. 이해할 수 없는 것은 관리할 수 없을 뿐 아니라, 작동시킬 수도 없기 때문이다. 당신이 시민으로서, 또는 전문가로서 그리고 행복을 추구하는 인간으로서 마땅히 머신러닝을 이해해야 한다는 것이다.
그는 저서 '마스터 알고리즘'을 통해서 기술을 효과적으로 사용하기 위해서 알아야 하는 개념모형으로서의 머신러닝을 소개한다. 그렇지만 개략적인 지식의 전달 뿐만 아니라, 머신러닝이 목적으로 하는 다양한 이론(알고리즘)과 결과물 그리고 그러한 것들이 상호 보완되고 중첩되는 부분들에 대한 통합적인 접근과 이해를 제시한다.
그가 던진 한 마디가 재미있으면서도 의미심장하다. “머신러닝이 인공지능의 하위 범주이긴 하지만, 오히려 중요한 것은 머신러닝이다.”
◆ “몇 가지 아이디어를 보면, 숲이 보인다"...5종족의 머신러닝
▲마스터 알고리즘 한국판
머신러닝은 수많은 다른 이름으로 불려진다. 패턴인식, 통계 모형, 데이터마이닝, 지식추론, 예측분석, 데이터사이언스, 적응형 시스템, 자기조직화 시스템 등으로 불려진다. 그리고 다양한 결과와 예측을 만들어 내는 수백가지의 알고리즘이 매년 발명된다.
머신러닝의 대표적인 알고리즘은 최소제곱법, 로지스틱을 포함한 다양한 종류의 회귀분석, 의사결정 트리, 역연역법, 구조를 학습하는 유전자 프로그래밍, 퍼셉트론, 다층퍼셉트론, 오토인코더, CNN, RNN, 나이브 베이즈, 베이즈 네트워크, 마르코프 사슬, 은닉마르코프 모형, CRF, 칼만 필터, 마르코프 연쇄 몬테카를로, 마르코프 네트워크, 최근접 이웃 알고리즘, 서포트 벡터 머신, K-평균 알고리즘, EM 알고리즘 등이 있으며, 많은 알고리즘들이 수학으로 인한 소화불량을 일으킨다.
그렇지만 다행스럽게도 도밍고스는 그 기초는 몇 개의 아이디어라고 말한다. 이 몇 개의 아이디어를 이해하면 쉽고 통합적인 접근이 가능하다. 머신러닝의 근본은 간단하기 때문에 ‘러시아 인형(마트료시카, 인형속에 또 인형이 나오는 러시아 특산품)’을 꺼낼 때처럼 수학과 전문용어의 층들을 하나씩 벗겨 내는 방식을 사용하면 된다. 그는 오히려 멀리서 숲으로 다가오는 비전문가가 이미 특정한 나무의 연구에 깊이 빠진 전문가보다 더 나을 수 있다고 말한다.
도밍고스는 머신러닝을 다섯 종족으로 나누었다. 역연역법을 사용하는 기호주의자, 역전파를 사용하는 연결주의자, 유전자 알고리즘을 사용하는 진화주의자, 베이즈 추정을 사용하는 베이즈주의자, 서포트 벡터 머신을 사용하는 유추주의자로 나누었다.
그는 이러한 구분을 기반으로 계보학적인 접근을 시도하는데, 매우 흥미롭다. 각각의 종족들은 서로 의존하고 침범한다. 하지만 자신만의 차별화된 능력을 선보일 수 있는 본무대를 여전히 갖고 있다. 도밍고스의 최종적인 목적은 좀더 범용적으로 활용될 수 있는 궁극의 ‘마스터 알고리즘’을 발명하는 것이다. 책의 후반부는 이러한 목적을 위해 과감한 경계넘기를 통해 다섯 종족의 영역 통합을 시도한다.
◆ “머신러닝은 인류의 지식 발견 방법을 바꿨다"
머신 러닝은 학습과 발견이라는 인간의 지적 능력의 확장이다. 머신러닝은 진화와 신경세포와 같은 자연과학적인 발전을 기반으로 하는 경우도 있고, 인간의 고유한 능력인 논리적 사고 규칙에 기반한 경우도 있다. 전자가 진화주의자 연결주의자이고, 후자가 기호주의자이다.
인간이 적절한 객관적인 지적 능력을 갖추기 위해서 오랜 시간의 자극과 시행착오가 필요하듯이, 머신러닝 역시 마찬가지이다. 데이터로부터 학습한 내용이 과적합할 우려가 있고, 국소 최적화의 문제를 비롯해 잡음에 의한 간섭문제, 현실의 다양한 차원과 관련된 문제가 생긴다. 냉철한 평가나 검증을 위해 학습되지 않은 데이터가 필요하다.
오늘날 머신러닝의 강자가 된 딥러닝 역시 그 적용 범위가 아직은 협소하며, 인지를 중심으로 하는 인간의 소뇌 활동의 범위와도 유사하다. 때로는 머신러닝이 배울 수 있는 범위를 엄격하게 제한해야 할 수도 있다. 다만, 머신 러닝은 인간이 갖는 인식의 과부하, 한정된 수량만 유지할 수 있는 협소한 단기 기억량 등의 제약점은 없다.
도밍고스는 머신러닝이 인류의 인식과 지식 생산에 관한 새 지평을 열었다고 평가했다. 예전에는 오류를 잘못된 것으로 최소화하고, 선입견을 회피하는 것이 지식에 근접하는 올바른 방법이었다. 그리고 데이터로부터 일반적이고 보편적인 지식 획득에 회의적이었다.
머신러닝에서 오류는 잘못된 것이 아니라 오히려 지식의 단초를 제공하는 하나의 규칙으로 활용될 수 있다. 상호독립이라는 가정이나 임의의 초기값 역시 더 나은 지식을 획득하기 위한 사전 단계가 될 수 있다.
각종 선입견도 기계학습의 단초가 될 수 있다. 머신 러닝은 ‘우리가 본 것에서 시작한 일반화를 보지 못한 것까지 적용하는 일을 어떻게 정당화할 수 있는 지’에 대한 답을 주고 있다.
그의 저서 '마스터 알고리즘'의 후반부는 상대적으로 편한 자세로 읽어 나갈 수 있다. 인공지능과 관련된 미래사회를 그리고 있다. 전쟁과 무기에 관해서, 직업의 소멸과 기본소득 그리고 이를 위한 민주주의, 공유와 사생활, 스카이넷 그리고 진화. 사실 손쉬운 논쟁거리가 충분히 될 만큼 직접적이고 분명하게 그려낸다.
미래는 인간성을 위협하는 특이점으로 수렴하는 것이 아니라 야만성이 약해지고, 오픈소스 운동처럼 인간의 본연의 선의가 더 많아지고 중요시된다. 데이터의 불균형으로 인한 힘의 불균형을 초래할 가능성이 있지만 민주적인 제도에 의해서 효과적으로 해결할 수 있다.
☞ 스마트클라우드쇼 2017
행사명 : 스마트클라우드쇼2017 (제7회 스마트클라우드쇼)
기간 : 2017.9.14(목)-9.15(금)
장소 : 소공동 조선호텔 그랜드볼룸
주제 : 매트릭스 사회로의 진입 -인공지능·클라우드 혁명부터 가상화폐 신드롬까지
(Login to Matrix - From AI and Cloud Revolution to Virtual Currency Syndrome)
첫째 날(9/14) - 인공지능 혁명, 가상현실·화폐 혁명의 모든 것
둘째 날(9/15) - 클라우드 혁명의 모든 것
홈페이지 : http://smartcloudshow.chosunbiz.com
문의 : 스마트클라우드쇼2017 사무국 02-724-6157, event@chosunbiz.com
☞ [로그인 투 매트릭스] 기사를 후원합니다.