
“생성 AI(Generative AI) 기반의 거대 언어 모델(LLM)은 다양한 언어 이해를 넘어 문화까지 이해해야 한다. 한국에 있는 사용자가 질문했을 때 한국의 문화적 맥락에 뿌리를 두고 답을 도출하는 모델이어야 한다. 구글이 지금 연구하는 부분이다.”
마니시 굽타(Manish Gupta) 구글 딥마인드 시니어 디렉터는 최근 인터뷰에서 “생성 AI를 기반으로 한 파운데이션 모델이 창의성의 새로운 장을 열고 있지만 여전히 도전 과제가 남아있다”며 이같이 밝혔다. 그는 한국의 새 정부를 비롯해 인도와 동남아 국가가 추진 중인 소버린 AI(Sovereign AI·특정 국가에 종속되지 않는 독자적인 AI) 파트너로서의 구글의 역할을 강조하기도 했다.
7월 2일 열린 ‘구글 포 코리아(Google for Korea) 2025’ 행사 참석차 방한한 굽타 박사와 구글 랩스의 사이먼 토쿠미네(Simon To-kumine) 디렉터를 만났다. 구글 딥마인드는 생성 AI 제미나이와 단백질 구조를 예측하는 알파폴드 개발 같은 원천 기술 연구를 맡고, 이들 신기술을 현장에서 응용할 상품을 만드는 곳이 구글 랩스다. 다음은 일문일답.
생성 AI가 안고 있는 가장 큰 도전은.
마니시 굽타(이하 굽타) “생성 AI 모델이 영어뿐 아니라 세계 다른 지역 수십억 명이 쓰고 있는 다양한 언어를 어떻게 이해하게 할 것인가라는 과업이 중요한 도전 과제다. 모델이 다양한 언어를 단순히 이해하는 것을 넘어 문화까지 이해해야 한다. 한국 사용자가 질문했을 때 모델이 그 답을 영어로 작성한 후 한국어로 번역해서 제시하는 게 아니라, 한국의 문화적인 맥락에 뿌리를 두고 답을 도출할 수 있도록 해야 한다는 얘기다. 지금 구글이 연구하는 부분이다.”
소버린 AI 추진 배경에 AI 모델 주도국의 가치관에 종속될 수 있다는 우려와 통하는 얘기인 거 같다.
굽타 “구글은 젬마(Gemma)라는 오픈 모델을 좋은 출발점으로 해서 인도의 소버린 AI 개발에도 협력하고 있다. (싱가포르 정부가 2017년 출범시킨) AI 싱가포르와도 싱가포르 및 동남아 국가를 위한 소버린 AI 모델 개발을 위해 협력하고 있다. 또 독자적인 LLM을 개발하려는 기업을 위해 AI에 특화된 하드웨어 그래픽처리장치(GPU) 등을 제공하는 클라우드 서비스도 있다.”
구글은 알파폴드 같은 원천 기술을 개발해 오픈소스로 제공한다. 이유가 뭔가.
굽타 “구글 딥마인드가 개발한 알파폴드 덕분에 박사급 연구원이 3~5년간 연구해야 알 수 있는 단일 단백질 구조를 몇 분 안에 파악할 수 있게 됐다. 2억 개에 달하는 단백질 구조가 모두 구글 딥마인드 팀에 의해 공개됐다. 알파폴드를 오픈소스로 공개했는데, 애초엔 신약 개발을 위한 상업용으로 추진했다. 하지만 인류에게 매우 중요하고, 구글 내에서만 진행하기에는 너무 거대한 일이어서 무료 공개를 결정했다. 현재 전 세계 200만 명이 넘는 연구자가 알파폴드를 활용해 신약과 생분해 가능 플라스틱 개발 등 다양한 연구를 수행 중이다. 한국에서도 6만5000명이 알파폴드를 활용하고 있는데 카이스트 송지준 교수가 암 치료제 개발에 활용하는 게 대표 사례다.”

구글은 AI의 원천 기술을 넘어 당장 소비자와 기업이 쓸 수 있는 기술도 개발한다. 어떤 방향성이 있나.
사이먼 토쿠미네(이하 토쿠미네) “구글 랩스는 AI 기술로 가능한 신상품을 발굴해 제공한다. 인류를 위한다는 구글의 미션 달성을 돕는 일이다. 크게 두 가지 방향으로 진행 중이다. 트랜스포메이션(전환)과 컬래버레이션(협업)이 그것이다.”
사례를 들어 설명해 달라.
토쿠미네 “제미나이 모델을 기반으로 한 트랜스포메이션 사례로, 노트북LM이 있다. 사용자가 제공하는 정보만을 기반으로 해서 통찰을 추출하고 사용자가 좀 더 쉽게 이해할 수 있도록 새로운 포맷으로 만들어 준다. 사용자가 업로드한 여러 문서에서 전체적으로 어떤 주제가 다뤄지고 있는지, 마인드맵을 제시해 좀 더 쉽게 핵심을 파악할 수 있도록 한다. 팟캐스트 같은 형식으로 전환하는 기능도 있다. 내가 질문을 던질 필요 없이 (AI가 만든) 진행자와 참석자가 질의응답하는 식이다. 음성 형태여서 클릭 한 번으로 운동하면서, 산책하면서 또는 운전하면서 들을 수 있다. 최근 한국어 지원도 시작됐다. 나만을 위한, 한 사람만을 위한 콘텐츠를 AI가 만들어내는 것이다. 출퇴근 문화에까지 영향을 준다. 최근 구글 개발자 콘퍼런스(구글 I/O)에서 발표된 영상 생성 툴인 플로는 크리에이터가 그 콘셉트를 빠르게 테스트할 수 있도록 한다. 머릿속에 보였던 그림, 창조적 아이디어를 순식간에 점검할 수 있게 한다. 영화 제작자는 영상을 편집하는 게 아니라 비디오게임을 하는 거 같다라는 반응을 보였다.”
컬래버레이션 사례는.
토쿠미네 “트랜스포메이션이 AI의 1막이었다면, 2막은 훨씬 초기 단계에 있는 개념으로 AI가 ‘협력자’ 역할을 하는 거다. AI가 한 결정을 실제 행동으로 옮길 수 있는 것을 의미한다. 트랜스포메이션은 그냥 답을 제시하지만, 컬래버레이션은 행동한다. 구글 웹브라우징 에이전트인 마리너(Mariner)는 가족을 위해 요리할 때 부족한 재료를 파악하는 것은 물론 재료 구매까지 돕는다. 마리너가 필요한 식자재를 장바구니에 담아주고, 사용자는 결제 버튼만 누르면 된다. 협력자로서 AI는 단순 도구가 아니다. 망치가 빌딩 도면을 이해하지 못하는 것과 같다. 모두가 AI 엔지니어가 될 필요는 없지만, AI가 나의 협력자가 될 수 있도록 기술을 더 잘 활용해야한다.”
구글은 생성 AI 모델의 기초가 된 트랜스포머를 비롯해 알파폴드 같은 원천 기술을 어떻게 남보다 앞서 개발할 수 있었나. 대단한 인재를 잘 확보한 덕분인가.
굽타 “훌륭한 인재를 확보한 측면도 있지만 기존의 것을 20%, 30% 개선하는 게 아니라 정말 10배 나은 것을 계속해서 추진하고 탐구하는 문샷 싱킹(Moonshot Thinking)을 독려하는 문화 덕이 크다. 사실 돌파구적인 결과물이 없는 부문의 리더는 고과를 낮게 받는 게 구글 문화다.
특히 문샷 싱킹 과정 자체를 소중히 여길 수 있도록 한다. 결과가 나오지 않고 실패한다고 해도, 실패도 기념하는 그 과정을 소중히 하는 문화가 있다.”
구글은 2016년 바둑 AI 알파고를 통해 강화 학습 기법을 처음 제시했고, 전 세계 LLM 개발자 대부분이 채택하는 아키텍처 트랜스포머를 2017년 개발했으며, 오픈AI가 2024년 첫 추론형 모델을 개발하는 데 기반이 된 생각 사슬(Chain of Thought) 기술을 2022년 처음 개발했다.
‘AI가 모든 것을 대신하고 사람이 하는 영역이 이제 없어진다’라는 우려가 있다.
굽타 “전혀 그렇지 않다고 본다. 사람과 함께 손잡고 했을 때 그 구체적인 효익이 드러난다. 특히 AI 비용이 2015년 이후로 매년 10분의 1 수준으로 떨어지고 있다. 빈곤국까지 보편화 대중화가 빠르게 이뤄질 것으로 본다.”
약 한 달 전 출범한 이재명 정부가 AI 3대 강국 구호를 내걸었다. AI 강국의 의미는. 또 이를 위한 조건은.
굽타 “AI 강국에 대해 각국은 스스로 가장 의미 있는 정의를 내려야 한다. 그 맥락에서 AI를 진화시켜야 한다. 삼성과 LG 제품을 전 세계 수억 명의 소비자가 좋아하는 것처럼, 한국은 제조업 강국의 위치를 고려하면서 여러 방향을 모색할 수 있다. 로봇을 더 많이 활용하고, 생산성 증대를 위해 AI를 활용하고, 고령화를 고려해 사람이 하는 위험한 일의 대안을 AI에서 찾는 것 등을 고민해 볼 수 있을 것이다.”