
“숫자에 대한 유사과학이 새롭게 등장해 번성하고 있다. 하지만 이 유사과학은 자의적이고, 제대로 인과관계를 설명하지도 않으며, 규제받지 않는데다 자주 불공평한 결과를 낳는다.”
IT(정보기술) 발달로 폭발적으로 늘어난 데이터를 분석·활용하는 ‘빅데이터(big data)’가 각광받으면서 경영학계 일각에서는 빅데이터의 위험성을 경계하는 목소리가 높아지고 있다. 미국 매사추세츠공과대학(MIT), 펜실베이니아대 등 주요 대학 MBA(경영대학원)는 이를 주제로 한 글을 잇따라 발간했다. 그 가운데는 빅데이터가 ‘새로운 대량살상무기(WMD·weapons of mass destruction)’라는 주장마저 있다. 빅데이터 분석을 사용하는 기업 입장에서 데이터 수집 및 분석 기법을 정교화하는 한편, 윤리적인 문제가 발생하지 않도록 세심한 주의를 기울일 필요가 있다는 게 대체적인 의견이다.

“비과학적 데이터 분석, 오판 유도”
미국 바너드대 수학과 교수 출신으로 헤지펀드 디이쇼 등에서 퀀트(quant·계량분석가)로 일했던 케이시 오닐(Cathy O’Neil)은 9월 <수학적 파괴의 무기(Weapons of Math Destruction)>라는 제목의 책을 출간했다. 대량살상무기(WMD)를 의식해서 붙여진 제목처럼 빅데이터 분석이 어떤 경제적·사회적 문제를 일으킬 수 있는지 신랄하게 비판하는 내용이었다. 이 책은 출간되자마자 큰 화제를 불러일으키며 전미도서상 비소설 분야 후보에 올랐다. 무엇보다 다양한 분야에서 경험을 쌓은 1급 데이터 분석 전문가가 경고장을 날린 것이라는 게 인기의 배경이다. 오닐은 하버드대 박사 출신으로 미국의 대표적인 인문학 대학인 바너드대에서 일하다, 금융계로 진로를 바꿨다. 이후 컬럼비아대 데이터분석센터 컨설턴트, 금융 리스크 분석 소프트웨어 회사 리스크메트릭스(RiskMetrics), 데이터 분석 기반 미디어 스타트업 인텐트미디어(Intent Media) 등에서 일했다.
오닐은 2008년 글로벌 금융위기의 주범 가운데 하나였던 주택담보대출 파생금융상품이 빅데이터 분석에 쓰이는 수학적 알고리즘을 이론적 기반으로 삼고 있었다는 것부터 지적했다. 그는 “정교한 수학이 쓰였지만, 정작 현실에 맞춰 교정할 수 있는 기능은 결여돼 있었다”며 “수학이 오용된 대표적인 사례”라고 설명했다. 오닐은 뒤이어 2009년 미국 워싱턴 D.C.에서 이뤄진 교사 평가, 미국 내 24개 주에서 쓰이는 재범 확률 예측 기법 등의 문제점을 지적하며 데이터 분석의 오용(誤用) 사례가 늘어나고 있다고 경고했다. 자세히 뜯어보면 논리적 일관성이나 엄밀성이 부족해 신뢰할 수 없는, 일종의 ‘유사과학’이 숫자를 무기 삼아 활개치고 있다는 얘기다.
미국 펜실베이니아대 와튼 경영대학원은 9월 온라인 경영정보 매체 와튼 지식창고(Knowledge@Wharton)에 ‘불량 알고리즘과 빅데이터의 어두운 면’이라는 제목의 기사를 게재하고 제대로 검증받지 못한 빅데이터 분석 기법의 위험성을 경고했다. 기사를 쓴 사람은 로저 본(Roger Bohn) 미국 캘리포니아 주립대(UCSD) 교수였다. 본 교수는 “데이터를 분석해 모종의 결과를 도출하는 수학적 알고리즘은 이제 우리 삶에 많은 영향을 미치기 시작했다”며 “하지만 여기에 쓰인 데이터 분석 방법이 적합한지에 대한 검증은 제대로 되고 있지 않다”고 지적했다.
본 교수는 “오닐이 지적했듯이 벌써부터 빅데이터 분석이 잘못 쓰이는 경우가 여러 건 발생하고 있다”며 “검증되지 않은 데이터 분석 때문에 정부나 기업이 심각한 실책을 저지를 수 있다는 뜻”이라고 덧붙였다. 특히 그는 “여러 기업에서 빅데이터 분석 기법을 고객 신용 평가에 사용하는데, 정작 어떤 ‘공식’에 따라 평가가 이뤄지는지는 제대로 검증되지 않고 있다”고 비판했다.

“고객 신뢰 없는 데이터 수집, 역풍 맞을 것”
MIT 슬론 MBA는 <MIT슬론매니지먼트리뷰> 2016년 가을호에서 ‘미래의 디지털 경영 탐구’라는 주제로 빅데이터 분석 기법을 다뤘다. 그 가운데 ‘데이터 분석 자료의 설계 및 개발’이란 글에서 토머스 데이븐포트(Thomas Davenport) 밥슨대 교수는 “미국 40여개 기업의 빅데이터 분석 담당 임직원들을 대상으로 조사를 실시한 결과, 명확한 전략과 개발 과정 없이 빅데이터 분석에 나선 기업들이 여러 곳 있었다”고 지적했다. 데이터 분석이 유행하고 있지만 정작 ‘왜’ ‘무엇을’ ‘어떻게’ 분석해야 할지 모르고 헤매는 곳이 많다는 얘기다.
데이븐포트 교수는 빅데이터 분석을 ‘분석 목표 개념화→데이터 획득→정교화→데이터 저장 및 검색→분석 결과 배포→발표→피드백’의 7단계로 나누고, 각 단계별 프로세스를 명확히 세워야 한다고 강조했다.
한편 ‘데이터 윤리를 통해 신뢰 확보하기’라는 글에서 폴 도허티(Paul Daugherty) 액센추어 최고기술책임자(CTO)는 “IT의 발달로 모을 수 있는 데이터의 양과 질은 크게 발전했고 비용도 감소했지만, 사전에 고객과의 신뢰가 구축되지 않은 상태에서 섣부르게 데이터 수집에 나섰다가 거센 역풍을 맞을 수 있다”고 분석했다. “자신들을 감시하는 것 아니냐는 고객의 불만이 폭발해 기업 이미지를 망치게 될 위험성이 크게 높아졌다”는 설명이다. 이러한 문제를 극복하기 위해서는 “미리 디지털 윤리 기준을 명확히 정하고, 데이터 수집 및 분석에 대한 모범 사례를 확보해 각 부서 내 담당자들이 이를 따라가도록 해야 한다”고 도허티 CTO는 조언했다.