인텔, 엔비디아, 브로드컴, 퀄컴 등 글로벌 반도체 기업은 온디바이스 AI(On-Device AI·인터넷 연결 없이 기기 자체에서 실행되는 AI) 시장 정복을 위해 지난 10년간 에지(edge)용 인공지능(AI) 시장에 도전장을 던졌지만, 아직 확실한 지배자는 없다. 에지용 AI 반도체를 기반으로 한 온디바이스 AI는 사실상 소비자 입장에서 AI 기술의 효용성을 가장 피부로 체감할 수 있는 분야다. 컴퓨터 비전 기술을 바탕으로 한 인물, 물체 인식을 비롯해 사물인터넷(IoT), 자율주행차, AI 가전, 스마트 팩토리 등 활용 분야가 무궁무진하기 때문이다.

최근 경기 판교 본사에서 만난 김녹원 딥엑스 대표는 “육중하고 엄청난 숫자의 그래픽처리장치(GPU)로 이뤄진 데이터센터가 깊은 바다 한복판이라면, 에지 컴퓨팅 분야는 육지와 가까운 얕은 바다 같은 성격을 갖고 있다”고 설명했다. 

김 대표는 “최종 사용자가 사용하는 디바이스가 지연시간 없이 즉각적으로 벌어지는 상황을 AI로 분석하기 위해서는 데이터센터에 의존하지 않고 스스로 판단해 추론할 수 있는 칩 솔루션이 필요하다”며 “GPU는 이에 적합하지 않다는 것이 이미 오래전에 판명 났다. 너무 무겁고 비싸며 전력, 발열 등의 문제가 심각하므로 신경망처리장치(NPU)가 최적의 솔루션으로 떠올랐다”고 설명했다.

지난 수년간 한국 AI 반도체 기업의 기대주로 주목받아 온 딥엑스는 2025년 상반기 5㎚(나노미터) 기반의 첫 NPU 제품인 DX-M1의 대량 양산을 시작한다. 삼성전자 파운드리사업부에 수탁 생산을 맡긴 이 칩은 90%에 달하는 수율을 확보한 것으로 알려졌다. 경쟁사의 NPU가 10~20㎚대에서 생산되는 것과 달리 딥엑스는 선단 공정으로 NPU를 생산해 시장에서 압도적 지위를 노릴 예정이다. 

특히 DX-M1에는 김 대표가 애플, 브로드컴, 시스코, IBM 등 굴지의 반도체 기업 설계자로 활약하며 터득한 노하우가 고스란히 녹아들어 있다. 소프트웨어와 최적화를 통해 메모리를 덜 사용하면서도 더 높은 성능을 발휘하고, 막대한 수의 매개변수(파라미터)가 최선단 공정과 궁합을 맞춰 시장에 나와있는 칩의 4분의 1 크기로도 최소 네 배 이상의 성능, 전력 효율성, 가격 경쟁력을 갖출 것으로 예상된다. 

김 대표는 “DX-M1을 시작으로 향후 10년 정도의 여정을 내다보고 있으며, 딥엑스는 유니콘(기업 가치 10억달러 이상 비상장 기업) 정도가 아니라 수십조원 이상의 가치가 있는 글로벌 팹리스(반도체 설계 기업)로 성장하는 것을 목표로 하고 있다”며 “2025년 하반기부터 매출이 발생할 것”이라고 했다. 다음은 김 대표와 일문일답.

지난 수년간이 준비 과정이었다면, 2025년부터는 세계시장의 검증이다.

“딱 맞는 시기에 딱 맞는 제품이 나왔다고 생각한다. 만약에 NPU가 1990년대에 나왔다면, 아니 5년 전이었다면 시장의 외면을 받았을지도 모른다. AI 기술을 온전히 온디바이스로 구현할 수 있는 다른 생태계가 조성돼 있지 않았을 것이기 때문이다. 결국은  신기술 등장과 성공도 ‘타이밍’이 가장 중요하다. 3~4년 전까지만 해도 데이터센터 서버에서부터 AI 솔루션에 대한 애플리케이션 등이 정리가 안 됐지만, 지금은 어느 정도 시장과 개발에 대한 이해도가 높아졌다고 본다. 2~3년 전만 해도 고객사를 만나면 다 일일이 설명해야 했지만, 지금은 어디에 쓸지 정도는 다 알고 있다. 시장조사 업체 통계에서도 2026년쯤에는 중국에서 팔리는 IT 하드웨어 50%에 NPU가 탑재될 것으로 전망한다.”

AI가 사용자와 더 가까운 에지로 내려오고 있다.

“고객사가 원하는 응용처만 봐도 이제 카메라가 달린 모든 디바이스에 NPU가 탑재될 것이라는 것이 확실시된다. 아주 작은 디바이스부터 큰 디바이스까지 망라한다. 특히 중국 시장의 수요가 엄청날 것으로 본다. 다음은 로봇 같은 신시장이다. 무인화는 이제 완전한 시대의 흐름이다. 생산, 제조, 물류 등 많은 부문에서 자동화가 이뤄지고 있다. 카메라, 컴퓨터 비전 관련한 수많은 회사와 만나서 협업을 논의 중이다.”

에지 컴퓨팅에 대한 수요는 오래전부터 있었지만, 글로벌 반도체 기업도 완전히 정복하지 못했다.

“반도체 산업의 역사에서 이미 결정 난 것이다. 중앙처리장치(CPU)와 GPU는 에지 컴퓨팅에 부적합하다. 이는 과거 애플, 브로드컴, 시스코 등 미국 반도체 기업이 직접 칩을 개발하면서 확신한 부분인데, 그것이 실제 우리가 목도하고 있는 상황이다. 엔비디아 같은 기업의 GPU 기반 설계로는 에지용 칩을 싸게 만들 방법도, 저전력으로 구현할 방법도 없다. 그럴 의향도 없을 것이다. 

인텔 역시 상황은 비슷하다. 기업의 구조적 메커니즘으로 봐도 엔비디아나 인텔 같은 기업이 에지용 시장에서 성공할 수 없다. 온디바이스 AI를 구현하는 과정에서는 실시간으로 사용자 환경에 맞춰서 유연한 설계 변경과 시프팅이 필요하다. 얕은 바다에는 수심에 맞는 배가 필요하다. 엔비디아의 거대한 함선은 이 바다에 어울리지 않는다. 

예를 들어 엔비디아 같은 대기업이 설계를 바꾸는 것에는 엄청난 비용과 자원이 소모된다. 운영 비용이 맞지 않는 것이다. 똑같은 자원과 시간으로 엔비디아가 한 번 대응 가능한 고객사와 협업을 딥엑스는 50~60번씩 설계를 바꿔가면서 지원할 수 있다. 그리고 이 같은 생태계가 앞으로 10년은 갈 것이라고 본다.”

딥엑스의 NPU DX-M1. /딥엑스
딥엑스의 NPU DX-M1. /딥엑스

딥엑스가 가지는 팹리스로서 지향점은 엔비디아보다는 퀄컴이나 ARM에 더 가까운 것인가.

“그렇다. AI 반도체 시대 퀄컴이면서 ARM이 되는 것이 목표다. 온디바이스 AI가 AI 시대의 게임체인저가 될 것이라는 점에는 이미 어느 정도 공감대가 생겼다. 그러면 온디바이스 AI를 어떤 칩으로 돌릴 것인가. 먼 곳에 있는 데이터센터는 해줄 수 없다. 지금 당장 (서버 연결 없이) 처리해야 하는 AI 기술은 무엇이냐. 그게 실리콘밸리의 글로벌 기업에서 거액의 연봉을 거절하고 한국에서 딥엑스를 창업한 이유다. NPU는 온디바이스 AI의 필수 불가결인 존재이면서, 온디바이스 AI의 본체다.”

2025년에 양산하는 DX-M1은 기존 NPU와 상당히 다른 특성이 있다.

“딥엑스는 애플과 브로드컴의 DNA가 섞여 있다. 이번에 내놓은 칩 크기를 보면 시중에 판매되는 주류 NPU의 4분의 1 크기이면서 메모리 용량은 줄이는 반면 소프트웨어와 최적화에 전력을 쏟았다. 

내가 애플, 브로드컴 등에서 연구하면서 배웠던 소프트웨어, 하드웨어 동시 최적화 기술이 담겨있다. 모든 최적 포인트 파라미터를 잡아 최적화하니 공정 수율이 90% 정도 나오는 것이다.”

성능, 가격 접근법이 가장 중요한 마케팅 포인트다. 기준은 어떻게 잡았는가.

“실리콘밸리에선 기존 제품보다 네 배 수준의 성능, 가격적 이점이 있어야 한다. 거기서부터 시장 분리가 일어난다. 두 배 수준으로는 시장 패러다임을 바꾸기 어렵다. 최소 네 배 단위로 이겨야 하고, 딥엑스 역시 이를 지향점으로 준비해 왔다. 다만 이는 시장가격의 관점이고, 칩을 설계하고 개발하는 회사 입장에서는 열 배, 스무 배를 목표로 삼는다. 그렇게 목표를 만들어야 제조 양산과 판매 과정을 거치면서 네 배에서 열 배 수준의 성능, 가격 경쟁력을 가지게 된다.”

2025년에 기업공개(IPO)를 할 예정인가.

“아직 더 보여줘야 할 것이 있다. 유니콘은 상상 속 동물이지만 기업으로서 유니콘은 실재하는 결과가 뒷받침돼야 한다고 생각한다. 딥엑스의 단기 목표는 새롭게 열리는 온디바이스 AI 시장을 창출하는 데 기여하는 것이다. IPO는 기업 목표에 이르는 도구지 목표 그 자체가 아니기 때문에 기업 목표의 완수 과정에서 적절한 시기에 하는 게 이상적이라고 본다. 2025년은 딥엑스로서는 양산을 시작하기 때문에 매출을 창출해야 하는 의무가 있다. 대중이 인정할 만한 결과를 만들어 놓고 그 결과물로 박수받을 수 있을 때 상장할 수 있기를 희망한다.” 

황민규 조선비즈 기자