김우창 카이스트(KAIST) 산업 및 시스템공학과 교수 서울대 산업공학, 미 프린스턴대 금융공학 박사, SSCI 학술지 ‘Quantitative Finance’편집장
김우창
카이스트(KAIST) 산업 및 시스템공학과 교수 서울대 산업공학, 미 프린스턴대 금융공학 박사, SSCI 학술지 ‘Quantitative Finance’편집장

아이들이 살해당한다. 여행 가방에 갇혀 질식해 죽고, 물고문을 당하다 익사하고, 큰 교통사고 같은 심각한 외부 충격이 아니라면 다칠 수 없다는 췌장이 찢겨 죽는다. 하루가 멀다하고 들려오는 끔찍한 소식에 신과 같은 절대자의 존재를 찾거나, 인간의 본성에 대한 근본적인 질문을 던져보는 건 무릇 필자만이 아닐 것이다. 급격한 출산율 감소로 인한 충격으로 새로운 생명의 탄생을 늘리기 위해 국가적 역량을 총동원하고 있는 대한민국에서 이런 소식이 자주 들려오는 건 이 사회가 뭔가 심각하게 잘못됐다는 생각을 떨칠 수 없게 한다.

아동학대 방지는 무엇보다 조기 탐지가 중요하다. 아이들에게 가정은 우주다. 가정 밖의 세상을 경험하지 못한 아이들은 학대당하더라도 무엇이 잘못되었는지 알지 못한다. 행여 그것을 깨닫더라도 이를 세상에 알릴 방도가 없다. 따라서 주변 어른들이 끊임없이 관심 갖고 이상이 느껴진다면 즉시 관여하는 것이 이상적일 것이다. 하지만 이는 영화 속에서나 가능하다. 실제 문제가 있다면 관심이지만, 그것이 아니라면 오지랖이 되기 때문이다. 가정 내 내밀한 사연을 타인이 판단해 개입하는 것은 아주 부담스러운 일이다. 게다가 우리 모두는 우리 자신 앞에 놓인 일만으로도 버겁고 바쁘다.

이러한 상황을 고려하면 인공지능(AI)은 아동학대를 실시간으로 탐지할 수 있는 훌륭한 수단이 될 수 있다. 해외여행을 가서 해당 국가에서 처음으로 신용카드로 뭔가를 결제하려는데 거래가 안 되는 경험을 한 사람이 많을 것이다. 이는 대부분의 신용카드 회사가 평소 카드 사용 패턴과 다른 거래를 막는 이상거래탐지 시스템(fraud detection system)을 활용하고 있기 때문이다. 이때 일반적으로 사용되는 기법을 이상탐지(anomaly detection)라 부른다. 이상탐지 기법은 다양한 분야에서 활용된다. 제조업에서는 제품의 불량을 조기에 알아내는 데, 의료 분야에서는 의료 데이터로부터 비정상적인 환자 상태를 탐지하는 데 활용되고 있다.

수없이 많은 신용카드 결제에서 잘못된 거래를 탐지하고, 나노 단위 반도체 공정에서도 불량품을 쉽게 찾아내는데, 사람 눈으로 보면 쉽게 알 수 있는 아동학대 조기탐지 정도는 기술적으로 그리 어렵지 않은 일이라 생각한다.

AI를 활용해 아동학대를 조기에 탐지하려는 시도는 미국, 영국, 뉴질랜드, 네덜란드 등의 서구권 국가를 위주로 최근 활발하게 이루어지고 있다. 우리나라도 이러한 노력을 꾸준히 기울여 왔다. ‘e아동행복지원시스템’ 같은 빅데이터 기반 위기 아동 발굴 시스템이 좋은 예다. 다만 이 시스템은 아동학대의 1차적이고 예방적인 접근을 목적으로 하기 때문에 아동학대의 조기탐지 혹은 실시간탐지 기능은 떨어질 수밖에 없다. 일례로 최혜영 더불어민주당 의원실이 2020년에 발표한 자료에 따르면, 최근 3년간 해당 시스템이 학대 의심 아동으로 분류한 아동은 17만 명이 넘었다. 하지만, 실제로 경찰에 신고된 사례는 96명으로 시스템이 학대 의심 아동으로 분류한 아동의 0.07%에 불과했다. 건강하고 안전한 아동양육 환경 조성 혹은 사후 처리라는 관점에서는 충분히 좋은 시스템이지만, 당장 죽음의 위기에 처해 있는 아이들을 찾아내기에는 충분치 못한 셈이다.

신종 코로나 바이러스 감염증(코로나19) 상황이 길어지며 대면활동이 극단적으로 줄어들게 되었고, 데이터를 기반으로 한 아동학대 실시간 탐지의 필요성은 그 어느 때보다도 커졌다. 고무적인 사실은 해당 분야 전문가들이 이를 구체적으로 실현하기 위한 청사진을 속속 내놓고, 국가 차원에서의 노력도 본격화하고 있다는 점이다. 예를 들어 백선희 전(前) 육아정책연구소 소장은 작년 가을 한 유관 학회에서 AI를 활용한 아동학대 조기탐지 시스템의 필요성을 역설했다. 한은희 한국사회보장정보원 부연구위원은 국가 차원의 구체적인 액션 플랜을 제안한 바 있다. 또 필자가 속한 카이스트(KAIST) 산업 및 시스템공학과에서는 AI를 통한 복지 시스템 개선을 학과의 핵심 미래 연구 분야로 선정하였다. 당연히 아동학대 실시간 탐지 시스템 개발은 우리 학과의 주된 연구 주제가 될 예정이다.


양부모에게 학대당해 숨진 16개월 영아 ‘정인이 사건’의 증인신문이 열린 2월 17일 서울 양천구 서울남부지법 앞에서 시민들이 시위하고 있다. 사진 연합뉴스
양부모에게 학대당해 숨진 16개월 영아 ‘정인이 사건’의 증인신문이 열린 2월 17일 서울 양천구 서울남부지법 앞에서 시민들이 시위하고 있다. 사진 연합뉴스

데이터공개·제도정비·낙인효과 방지

많은 사람이 본격적으로 노력하기 시작했으니 언젠가는 충분히 좋은 성능의 시스템이 만들어질 것이다. 다만 그 시간을 단축하고 현실 적용을 가능케 하기 위해 정부 차원의 사전적 노력 세 가지가 필요하다.

첫째, 데이터 공개다. AI는 데이터를 먹고 자란다. 아무리 좋은 알고리즘이라도 데이터가 없으면 의미 없는 코드의 집합일 뿐이다. 아동학대탐지는 기술적으로는 반도체 공정의 불량탐지와 크게 다를 것이 없지만 학습에 필요한 데이터가 아주 민감한 개인정보라는 점에서 본질적인 차이가 있다. 개인정보를 연구목적으로 활용하기 위해서는 가명처리를 하게 된다. 이때 상당히 많은 예산이 소요되며, 가명처리를 한 이후에도 추가정보와 결합되는 경우 개인정보를 복원할 수 있기 때문에 과제를 수행하는 특정 연구자를 제외하고는 해당 데이터를 볼 수 없게 하는 것이 일반적이다.

하지만 이래서는 진도가 나가지 않는다. 잘 작동하는 AI를 만들기 위해서는 피처 엔지니어링(feature engineering)이라는 과정이 필수다. 이는 소위 ‘노가다’ 영역이다. AI의 성능은 투입된 맨아워에 비례한다. 따라서 소수의 연구자에게만 해당 데이터를 공개하는 것은 정부가 국정감사 때 욕을 먹지 않기 위한 면피성 액션일 뿐이다. 전 세계 연구자들은 새로운 AI 적용 문제를 찾아 헤매고 있다. 장담컨대 아동학대 방지 같은 숭고한 목적을 달성할 수 있는 데이터가 공개되면 그 즉시 밤을 새워가며 연구를 개시할 사람이 수없이 많이 나올 것이다. 구글이나 애플의 엔지니어도 참여할지 모른다. 최소한 필자는 그럴 예정이다. 데이터 공개는 현실에 적용 가능한 수준의 AI를 아주 짧은 시간에 만들어내기 위한 필수조건이다.

둘째, 제도 정비다. 아무리 좋은 AI라 해도 100% 예측을 하는 것은 불가능하다. 학대받지 않는 아이를 학대받고 있다고 판단하는 경우도 있고, 그 반대 사례도 있을 것이다. 비록 AI가 학대 가능성을 점쳤다고 하더라도 최종적인 개입 여부 결정은 필연적으로 현장 근무자의 판단에 맡길 수밖에 없다. 따라서 현장 근무자에게는 아동이 학대받지 않고 있지만 학대받았다고 판단해 개입한 경우, 면책조항이 주어져야 한다. 남의 아이가 학대당하는 것은 가슴 아픈 일이지만, 적극적인 개입으로 내가 피해를 볼 가능성이 있다면 소극적일 수밖에 없기 때문이다.

이런 맥락에서 지난 2월 국회 본회의를 통과한 아동학대범죄처벌특례법 개정안에 유일하게 반대표를 던진 김웅 국민의힘 의원 생각에 동의한다. 소위 ‘정인이 법’이라고 불리는 이 법은 고의로 아동을 학대해 사망케 한 사람은 살인죄보다 높은 처벌을 받게 하는 것을 골자로 한다. 듣기만 해도 끔찍한 아동학대 소식에 가해자를 극형에 처하게 하고 싶은 것이 인지상정이다. 하지만 형을 올려서 줄어드는 범죄는 작은 범죄다. 큰 범죄는 형량과 발생 빈도가 관계없음이 잘 알려져 있다. 우리가 원하는 것은 그러한 사건 자체를 막는 것이다. 지금 중요한 것은 아동학대가 발생하기 전에 국가가 개입할 수 있도록 제도와 시스템을 정비하는 것이지 형량을 올리는 게 아니다.

마지막으로 아동학대 의심 정황이 있어 국가가 가정에 개입할 때, 해당 가정에 낙인효과가 발생하지 않도록 사회적 분위기를 조성할 필요가 있다. 필연적으로 발생할 잘못된 개입으로 행복하게 잘살고 있는 가정에 수치심을 주지 않는 것 역시 학대당하는 아동을 지키는 것만큼 중요하기 때문이다.