인공지능이 각본을 쓴 공상과학 영화 ‘선스프링’의 한 장면. <사진 : 유튜브 캡처>
인공지능이 각본을 쓴 공상과학 영화 ‘선스프링’의 한 장면. <사진 : 유튜브 캡처>

우주 공간에 있음직한 사무실 안에 한 명의 여자와 두 명의 남자가 있다. 얼핏 삼각관계로 보이는 이들이 심각한 대화를 주고받는다. 서로가 서로의 말을 이해하지 못하고 설명을 요구한다. 이들의 대화는 실제로 이해하기 힘든 수준으로, 기괴하게 전개됐다. 한 남자가 “돈을 확인해보자”고 말하자 다른 남자는 갑자기 입속에서 눈알을 토해낸다. 줄거리도 이해하기 어려운 건 마찬가지다. 하지만 미국의 인기 드라마 시리즈인 ‘실리콘밸리’의 주연배우 토머스 미들디치 등 출연진의 인상적인 연기 덕분에 그럭저럭 보고 있으면 어느새 엔딩 크레디트가 올라간다.

2016년 6월 영국에서 개최된 공상과학(SF)영화제 ‘사이파이 런던영화제(Sci-Fi London film festival)’에 출품된 단편영화 ‘선스프링(Sunspring)’ 이야기다. 9분짜리 단편영화인 ‘선스프링’이 주목받은 건 이 영화의 각본을 인공지능(AI)이 썼기 때문이다. ‘선스프링’은 48시간 안에 영화를 제작해야 하는 ‘48시간의 도전’ 부문에 출품됐는데, 180여 개의 출품작 중 10위권에 드는 데 성공했다. 르몽드는 ‘선스프링’에 대해 “시나리오에서 유기적인 연결성이 부족하다”면서도 보통 이상으로 뛰어나다고 평하기도 했다.


이야기꾼이 된 인공지능

‘선스프링’의 각본을 쓴 AI는 ‘벤저민’이다. 이 영화를 만든 오스카 샤프 감독과 뉴욕대에서 AI 기술을 연구하는 로스 굿윈은 영화 각본을 쓸 수 있는 AI를 만들어 벤저민이라는 이름을 붙였다. 벤저민은 SF 영화 각본을 쓰기 위해 1980~90년대에 나온 수십 편의 영화와 드라마 시리즈 각본을 섭렵했다. 벤저민이 분석한 작품에는 ‘2001 스페이스 오디세이’ ‘스타트렉’ ‘마이너리티 리포트’ ‘X파일’ 같은 명작들도 포함됐다. 샤프 감독은 “과연 AI가 영화 각본을 쓸 수 있을지에 대한 호기심에서 시작한 프로젝트였다”고 설명했다.

영화 각본뿐 아니라 소설 창작에 도전한 AI도 있다. 일본의 마쓰바라 히토시(松源仁) 공립 하코다테미래대 교수가 주도하는 ‘AI에 의한 소설 창작 프로젝트’ 팀은 2016년 기자회견을 열고 AI가 쓴 단편소설이 ‘제3회 닛케이 호시 신이치(星新一)상’ 예심을 통과했다고 밝혔다. 호시는 초단편 소설이라는 장르를 개척한 일본 최고의 SF 소설가로 꼽힌다. ‘기묘한 이야기’ ‘미래환상특급’ 같은 작품이 대표적이다. 마쓰바라 교수 연구팀은 AI에 호시의 소설 1000여 편을 학습하도록 한 뒤 새로운 이야기를 만들어내게 했다고 설명했다.

‘선스프링’과 마쓰바라 교수 연구팀이 만든 소설은 예술 분야에서 AI 기술이 가진 가능성과 한계를 동시에 보여준다. 일단 AI도 충분히 준비만 하면 인간의 영역으로 여겨지던 예술 작품의 창작이 가능하다는 걸 보여준 건 분명한 성과다. 미적 작품을 만들어내는 창작 활동은 AI가 어려움을 겪는 마지막 보루로 여겨졌다. 예술 작품을 만들기 위해서는 이성만큼이나 감정을 잘 이해해야 하는데, 인간의 감정은 같은 인간도 좀처럼 이해하지 못하는 영역이어서다.

반면 한계도 분명했다. 글로벌 컨설팅 업체인 맥킨지는 ‘선스프링’에 대해 “AI 기술이 더 발전하기 전까지는 시나리오 작가들이 필요하다는 사실을 확인할 수 있었다”고 평했고, 일본의 SF 소설가인 하세 사토시(長谷敏司)는 마쓰바라 교수 연구팀이 만든 소설에 대해 “인물 묘사 등에 한계가 있다”고 했다.


공포영화 ‘모건’의 예고편 속 한 장면. 인공지능이 고른 장면으로 만들었다. <사진 : 유튜브 캡처>
공포영화 ‘모건’의 예고편 속 한 장면. 인공지능이 고른 장면으로 만들었다. <사진 : 유튜브 캡처>

당장은 창작자가 아닌 조력자 역할

2016년에 나온 SF 공포영화 ‘모건(Morgan)’은 예고편을 공개하자마자 화제가 됐다. 제작자인 리들리 스콧이나 영화사인 20세기 폭스 때문이 아니었다. 예고편을 AI가 만들었다는 사실이 알려져서였다. 20세기 폭스는 이 영화의 75초짜리 예고편을 만드는 데 IBM의 AI인 ‘왓슨’이 참여했다고 밝혔다.

영화 예고편을 만들기 위해 왓슨은 다른 공포영화의 예고편 100편을 분석했다. 왓슨은 100편의 예고편을 2만2000개의 장면으로 쪼갠 뒤에 공포영화 예고편이 어떤 감정과 분위기로 짜여져 있는지를 스스로 학습했다. IBM 연구진이 왓슨에 모건 전체 영상을 입력하자 왓슨은 그 중에서 예고편에 넣기 적합한 장면들을 골라냈다.

각 장면들을 부드럽게 이어주는 편집 작업은 사람의 몫이었지만, 왓슨 덕분에 예고편 제작에 들어가는 시간과 비용을 크게 줄일 수 있었다. 이 작업에 참여한 IBM의 존 스미스(John R. Smith) 박사는 “영화 예고편을 만드는 작업은 전통적으로 노동 집약적인 작업”이라며 “사람이 모든 작업을 직접 할 경우 짧으면 열흘정도 걸리는데, 왓슨 덕분에 하루 만에 모든 작업을 마칠 수 있었다”고 말했다.

‘모건’은 ‘선스프링’과 또 다른 차원에서 AI 기술의 가능성을 보여준다. AI가 직접 예술 작품을 창작하는 게 아니라 조력자 역할을 맡는 것이다. 영화 제작 과정에서 AI를 활용해 시간과 비용을 줄일 수 있는 영역은 적지 않을 것으로 예상된다. 엔터테인먼트 분야의 기술 컨설팅 전문가인 셀리 파머(Shelly Palmer)는 한 인터뷰에서 영화 산업의 AI 기술을 신디사이저에 비유하기도 했다. 신디사이저가 등장하면서 한 명의 뮤지션이 다양한 악기를 동시에 연주할 수 있게 된 것처럼, 영화 산업에서도 AI를 활용하면 한 명의 감독이 열 명 몫의 일을 동시에 처리할 수 있게 될 것이라는 분석이었다.

세계 최대 영화사인 월트디즈니컴퍼니도 AI 기술에 많은 관심을 가지고 있다. 월트디즈니컴퍼니는 지난해 호주 멜버른에서 열린 인공지능국제회의(IJCAI)에서 사람들이 관심을 가질 만한 이야기를 골라주는 AI 기술을 개발했다고 발표했다. 디즈니 연구진은 미국판 지식인 서비스인 쿼라(Quara)에 올라온 글을 활용했다. 쿼라에서 추천을 많이 받은 글 가운데 서사구조를 갖춘 글을 AI에 입력해 사람들이 관심을 가지는 글을 골라낼 수 있게 한 것이다. 맥킨지는 AI 기술이 전문적인 시나리오 작가들을 도와 통찰력 있는 글을 쓸 수 있게 해줄 것이라고 분석했다. 동영상 편집에 AI를 접목한 서비스를 선보인 윕비츠(Wibbitz)의 최고경영자(CEO) 조하르 다얀(Zohar Dayan)은 ‘포브스’에 기고한 글에서 “AI는 영상 제작자에게 부담을 주는 시간 소모적인 작업을 줄여줄 수 있다”며 “AI는 좋은 이야기를 만들기 위한 조력자 역할을 할 수 있다”고 강조했다.


AI는 인간이 언제 눈물 흘릴지 알 수 있어

픽사의 애니메이션 ‘업(UP)’의 오프닝은 할리우드 최고의 오프닝 중 하나로 손꼽힌다. 13분 정도의 오프닝은 업의 주인공인 칼과 그의 부인 엘리의 한평생을 보여준다. 어린 시절 우연히 만나서 결혼에 성공하고, 아이를 가지려던 꿈이 무산됐지만 서로에게 의지해 살아가다 엘리가 먼저 세상을 떠나는 이야기가 잔잔하게 펼쳐진다. ‘업’은 엘리를 잃고 난 칼이 생전에 남아메리카 여행을 꿈꿨던 아내의 소원을 이뤄주기 위해 집에 수천 개의 풍선을 달고 여행하는 이야기다. 오프닝 이후의 이야기가 중심이지만, 오프닝에서 이미 많은 관객의 눈물샘을 자극했다.

맥킨지와 MIT 미디어랩은 이렇게 영화를 보는 관객의 감정적인 반응을 AI 기술을 활용해 미리 예상할 수 있는 방법을 찾았다. 영화의 특정 이미지가 사람에게 어떤 감정적인 반응을 이끌어내는지를 분석한 것이다. 가장 부정적인 감정 반응에 0점, 가장 긍정적인 감정 반응에는 1점을 주는 식으로 각각의 장면마다 0~1점의 점수를 매겨서 영화 전체에 대한 감정 반응을 그래프로 표시했다.

이 분석에 따르면 ‘업’의 오프닝에서 긍정적인 감정 반응이 가장 높게 나타난 순간은 칼과 엘리가 아기를 가지고 싶어하는 장면이었다. 이때 관객들의 감정 반응 점수는 0.65점에 가까웠다. 이후 엘리가 아기를 가질 수 없다는 사실을 알게 되면서 부정적인 감정 반응이 늘었다가 칼과 엘리가 늙은 이후에도 서로를 안아주며 격려하는 장면에서 다시 긍정적인 감정 반응이 증가했다. 오프닝의 마지막 즈음에서 엘리가 죽고 칼이 혼자 집으로 돌아오는 순간에 부정적인 감정 반응이 가장 크게 늘었다. 불과 1분도 안 되는 순간에 0.57점에서 0.39점 정도로 점수가 뚝 떨어졌다.

맥킨지와 MIT 미디어랩은 분석의 정확도를 높이기 위해 AI에 2000여 편의 영화를 학습하도록 했다. 할리우드 영화 500편과 동영상 공유 사이트인 비메오(Vimeo)에 올라온 단편영화 1500여 편이었다. AI는 영화마다 관객들이 보이는 감정 반응을 분석했고, 모두 2000여 개의 그래프를 만들었다. 맥킨지는 “2000여 편의 영화를 분석한 결과 사람들의 감정 반응을 크게 다섯 개의 그룹으로 묶을 수 있었다”고 설명했다.

연구진은 이 기술을 활용하면 영화의 흥행 가능성도 미리 예상하는 게 가능하다고 밝혔다. 맥킨지는 AI가 분류한 다섯 개의 감정 반응 그룹이 소셜미디어에서 각각 어떤 반응을 얻는지 지켜봤다. 그리고 특정한 종류의 감정 반응 그룹이 소셜미디어에서 더 많은 지지를 얻는다는 결론을 내렸다. 맥킨지는 “긍정적인 결말이 부정적인 결말보다 더 많은 지지를 얻었고, 결말에 이르기 전에 행복과 불행이 반복해서 주인공을 덮치는 등 감정의 굴곡이 많은 것도 중요한 부분이었다”고 지적했다.

물론 모든 영화를 똑같은 감정 반응 그래프로 만들 필요는 없다. 중요한 건 AI 기술을 활용한 이런 분석 결과가 시나리오 작가들에게 유용한 참고 자료가 될 수 있다는 점이다. 할리우드의 거장인 스티븐 스필버그의 작품도 항상 훌륭한 수준의 이야기를 보여주지는 않는다. 사람들이 어떤 장면에서 어떤 감정 반응을 보일지 미리 예측할 수 있다면 영화 시나리오 작가들이 이야기의 수준을 높이는 데 도움이 될 것이다.

디즈니도 비슷한 연구를 진행했다. 디즈니는 지난해 7월 국제전기전자기술자협회(IEEE) 학술회의에서 관객의 얼굴 표정을 실시간으로 분석해 영화에 평점을 매기는 기술을 개발했다고 밝혔다. ‘프베스(FVAEs)’라는 이름의 AI는 영화 초반에 단 몇 분 동안 관객들의 얼굴을 분석한 것만으로 영화 전체에 대한 평가를 예측할 수 있었다. 조하르 다얀 윕비츠 CEO는 “AI는 사람이 분간할 수 없는 수준의 디테일한 부분까지도 분석할 수 있다”며 “AI 기술을 스토리텔링에 활용하면 일관성 있고 매력적인 결과물을 만드는 데 도움이 될 것”이라고 말했다.


Plus Point

그림 그리고 작곡도 하는 인공지능

구글의 딥 드림을 활용해 그린 광화문 광장 그림. <사진 : 조선일보 DB>
구글의 딥 드림을 활용해 그린 광화문 광장 그림. <사진 : 조선일보 DB>

2016년 3월 구글은 인공지능(AI) 화가 ‘딥 드림(Deep Dream)’의 전시회를 열었다. 딥 드림은 반 고흐의 화풍을 학습해서 사용자가 제시한 이미지를 고흐의 그림과 비슷하게 변형하는 방식으로 새로운 이미지를 만들어냈다. 미국 샌프란시스코에서 열린 전시회에 출품된 딥 드림의 그림 29점의 판매 수익은 10만달러에 달했다. 구글이 딥 드림을 공개한 이후 마이크로소프트도 렘브란트의 화풍을 학습한 AI를 내놨다.

음악에서도 AI 기술은 상당한 성과를 내고 있다. 미국 예일대는 작곡 AI ‘쿨리타(Kulitta)’를 선보인 적이 있고, 스페인 말라가대는 작곡 AI ‘아야무스(Iamus)’를 개발했다. 아야무스는 이전에 나온 작곡 AI보다 한 단계 진화한 것으로 평가받는다. 기존 AI가 인간 작곡가의 스타일을 모방하는 데 그쳤다면, 아야무스는 주어진 테마를 무작위로 바꾸는 과정을 거치면서 인간 작곡가에게서 찾아보기 힘든 자신만의 개성을 나타냈기 때문이다. 아야무스의 곡은 런던 심포니 오케스트라가 연주하면서 화제가 되기도 했다.

구글도 작곡 AI를 개발하고 있다. 구글은 AI의 창작성을 연구하는 프로젝트인 ‘마젠타’를 진행하고 있다. 마젠타 프로젝트의 결과물 중 하나가 80초짜리 피아노곡인데, 첫 4개의 음표를 사람이 제공하자 AI가 나머지를 스스로 작곡해냈다. 구글은 “마젠타 프로젝트를 통해 AI가 설득력 있는 예술 작품을 만들 수 있는지, 불가능하다면 왜 그런지를 알아내는 것이 목표”라고 밝혔다.