김용석의 IT 월드 <16>

생성 AI가 쏘아 올린 반도체 전쟁

538호

2024.04.29 11:00

글로벌 반도체 산업이 생성 AI(Generative AI) 시장의 급속한 확대와 함께 격변기를 맞고 있다. 그동안의 전자 산업은 반도체의 성장과 함께 발전해 왔다. 1977년 개인용 PC인 ‘애플2’의 탄생이 정보화 혁명의 시작이다. 그렇지만 PC가 문서 작성이나 게임기 수준에서 일상생활을 크게 바꿀 수 있었던 것은 인터넷이 채택되면서부터였다. 컴퓨터가 인터넷을 통해서 가상 세계에 연결되면서, 우리의 삶은 많이 변화됐다. 검색 기반의 혁신적인 비즈니스 모델을 갖춘 구글, 네이버 같은 기업이 탄생했다. 이 시기는 PC용 핵심 반도체인 중앙처리장치(CPU)를 개발해서 인텔이 시장을 지배했다.

이동통신 4세대(4G) 시대가 열리면서, 스마트폰을 통해 사람들이 이동하면서도 PC 수준의 서비스를 받는 게 가능해졌고, 카카오톡과 같은 메신저가 사람들의 일상을 지배하기 시작했다. 스마트폰에서는 응용프로세서(AP) 반도체가 중심 역할을 하고 있다. 이것은 퀄컴, 미디어텍, 애플, 삼성전자가 주로 만든다.

지금은 인공지능(AI) 시대다. AI의 위력을 느끼게 해 준 것은 2016년 열린 이세돌과 AI ‘알파고’의 바둑 경기였다. 알파고를 승리로 이끈 주역은 반도체였다. 딥러닝 기술을 구현하는 데 쓰인 그래픽처리장치(GPU)였다. 당시 알파고에는 1920개의 CPU와 280개의 GPU 반도체가 사용됐다. 2022년 생성 AI 붐을 일으킨 챗GPT는 AI의 위력을 예고한 알파고의 충격과는 비교가 안 된다. 놀라운 사실은 AI가 사람에게 더 가까워지고 대화를 나눌 수 있는 상대가 됐다는 데 있다.

그런데 챗GPT가 똑똑해지려면 방대한 양의 데이터 학습을 해야 하므로 많은 연산량과 고속 데이터 처리 속도가 필수적이다. 또 매개변수라고 불리는 파라미터는 뇌의 학습과 기억, 연산을 담당하는 인간 뇌의 시냅스와 유사한 기능을 수행한다. 파라미터 수가 많을수록 AI는 높은 성능을 보이게 된다. 이로 인해, AI의 성능이 향상될수록 기존 반도체의 성능과 연산 방식을 뛰어넘는 반도체를 필요로 한다. 2022년 챗GPT가 AI 시대를 열수 있었던 것 역시 반도체의 힘이었다. 챗GPT의 AI 학습에는 무려 1만 개가 넘는 엔비디아의 A100 GPU가 사용됐다. 현재 엔비디아가 독주하는 가운데 오픈AI도 AI 칩 개발에 뛰어들기 위해 파트너를 찾고 있다. 구글·메타 등 글로벌 빅테크(대형 정보기술 기업)도 앞다퉈 AI 반도체 개발에 뛰어들었다. AI 반도체가 ‘게임 체인저’로서 시장의 전환을 이끌고 있는 것이다. 중국을 배제한 미국의 공급망 재편으로 시작된 미·중 반도체 패권 전쟁은 AI가 촉발한 시장 격변에 맞물려 총성 없는 반도체 전쟁으로 격화되고 있는 양상이다.

인공 신경망과 생성 AI의 탄생

생성 AI는 머신러닝 중 딥러닝의 일종이다. 그런데 딥러닝은 인간의 신경망을 본뜬 인공 신경망(Artificial Neural Network)에서 발전한 개념이다. 인간의 뇌는 뉴런이라는 수많은 신경세포로 이뤄져 있다. 뉴런은 신경세포체, 핵, 가지돌기, 축삭돌기, 시냅스 등으로 구성돼 있으며, 뉴런은 가지돌기에서 신호를 받아들이고, 이 신호가 일정치 이상의 크기를 가지면 축삭돌기를 통해 신호를 전달한다. 각각의 뉴런은 시냅스라는 연결 부위를 통해 수백수천 개의 다른 뉴런과 연결돼 있다. 한 뉴런의 흥분은 시냅스를 통해 다른 뉴런의 수상돌기로 전달된다. 인공 신경망은 앞서 설명한 사람 또는 동물 두뇌의 신경망에 착안하여 구현된 컴퓨팅 시스템으로 인간의 신경을 흉내 낸 딥러닝 기법을 말한다. 뇌의 뉴런과 유사한 정보 입출력 계층을 활용해 데이터를 학습한다.

김용석 성균관대 전자전기공학부 교수현 반도체공학회 고문,전 삼성전자 상무 — **김용석** 성균관대 전자전기공학부 교수
현 반도체공학회 고문,
전 삼성전자 상무

생성 AI 탄생에 중요한 발판이 된 것은 2014년 생성형 대립 신경망(Generative Ad-versarial Network)의 등장이었다. 이언 굿펠로(Ian Goodfellow)가 발표한 대립 신경망은 신경망이 서로 경쟁하면서 학습하는 구조다. 그 후 2017년 오픈AI의 첫 번째 생성 AI인 챗GPT1의 등장에 핵심적 역할을 한 것은 트랜스포머 기술이다. 2017년 구글은 한 논문(Attention is all you need)을 통해 ‘GPT (Generative Pre-trained Transformer)’의 기반이 된 트랜스포머 모델을 제시했다. GPT의 ‘T’도 이 트랜스포머에서 따왔다. 트랜스포머에는 정교함을 극대화하고자 ‘셀프 어텐션’이라는 기능이 포함돼 있다. 트랜스포머 모델은 따라서 다른 유형의 머신러닝보다 콘텍스트(context·문맥)를 더 잘 이해할수 있다. 예를 들어 문장의 끝과 시작이 어떻게 연결되는지, 문장의 단락이 서로 어떻게 연관돼 있는지 등을 이해할 수 있다. 불과 5년 전까지 가장 인기 있는 딥러닝 모델로 손꼽혔던 콘볼루션 신경망(Convolutional Neural Network)과 순환 신경망(Recurrent Neural Network)을 현재 트랜스포머가 대체하고 있다.

다음으로 거대 언어 모델(LLM)을 알아보자. 이는 언어 모델을 더욱 확장한 개념으로, 인간의 언어를 이해하고 생성하도록 훈련된 AI를 통틀어 LLM이라고 한다. 주어진 질문에 대해 인간과 유사한 응답을 생성하기 위해 방대한 양의 텍스트 데이터로 학습하므로 ‘Large(대규모)’라는 이름이 붙었다. LLM은 딥러닝, 특히 트랜스포머 모델을 기반으로 한다. LLM은 인터넷에서 수집된 수천 또는 수백만 기가바이트에 달하는 텍스트로 학습한다. 이를 통해 텍스트나 기타 콘텐츠를 인식, 번역, 예측 또는 생성할 수 있다. 하지만 샘플의 품질이 LLM이 자연어를 얼마나 잘 학습할 수 있는지에 영향을 미치므로, LLM의 프로그래머는 보다 엄선된 데이터 세트를 사용해야 한다. 오픈AI의 챗GPT를 비롯해서 구글의 제미나이, 메타의 LLaMA, 네이버의 하이퍼 CLOVAX가 있다.

격화되는 반도체 전쟁

반도체는 설계-제조-후공정(조립·테스트·패키징) 단계를 거치는데, 미국은 설계 부문만 주도하고, 생산과 후공정은 대만·한국· 중국 등 동아시아 국가들에 의존해 왔다. 그동안은 세계화에 맞추어서 철저한 분업화가 있었다. 그러나 미국은 중국의 반도체 산업 발전을 심각한 국가 안보 위협으로 규정해 중국 제재를 강화하고 있다. 미국은 2023년 반도체 칩과 과학법(칩스법)을 제정, 자국 내 반도체 직접 생산을 통한 글로벌 반도체 공급망의 새로운 질서를 주도하고 있다.

지금의 양상은 미·중 반도체 패권 전쟁 중 AI 혁명이 진행되면서 더욱 치열한 경쟁 구도로 가고 있다. AI 시대가 열리면서 AI 반도체의 중요성은 매우 커지고 있다. 미국 정부는 엔비디아 AI 칩의 중국 판매를 금지하고 있다. 고사양(A100, H100)부터 저사양(H800) AI 칩까지 모두 판매가 불가하다.

또한 2023년 10월 개정한 수출 규제를 통해 미국 기업이 핀펫(FinFET) 기술 등을 사용한 로직 칩(16㎚ 내지 14㎚ 이하)을 생산할 수 있는 장비·기술을 중국 기업에 판매하는 것도 사실상 금지했다. 중국이 AI를 자체 설계하더라도 제조를 못하도록 원천 봉쇄한 것이다. 그렇지만 중국도 만만치 않다. 2023년 8월 중국 화웨이는 프리미엄 스마트폰 ‘메이트 60’에 들어가는 AP를 SMIC 7㎚ 칩으로 제조했다고 해서 논란이 됐다. 중국은 파운드리(반도체 위탁 생산) 기업인 SMIC를 통해 반도체 자립화에 힘을 쏟고 있다. 궁극적인 목표는 군사적으로 중요한 AI 칩 확보라고 할 수 있다. 아무리 많은 돈이 들어도 어떻게든 자력으로 AI 칩을 개발해 미국과 맞서겠다는 것이다. 또한 중국은 메모리 분야도 키우고 있다. 양쯔메모리(YMTC)의 플래시 메모리 실력은 애플이 보급형에서도 검토할 정도로 제품이 상당 수준에 올라와 있다. D램(RAM)을 담당하는 창신메모리(CXMT)도 HBM(고대역폭 메모리) 개발에 착수했다는 소식이 들린다.

국내에서 데이터 센터용의 AI 반도체를 개발하는 스타트업은 퓨리오사AI, 리벨리온, 사피온이 대표적이다. 세 곳은 생성 AI에 최적화된 반도체를 개발 중에 있다. 이 중에서 퓨리오사AI는 2세대 칩인 ‘레니게이드’를 올해 3분기에 양산할 예정이다. 이 칩은 대만 TSMC의 5㎚ 공정으로 제조했으며, 추론용 신경망처리장치(NPU) 중 국내 최초로 HBM을 함께 사용해 챗GPT 수준의 LLM 구동이 가능하다. 이들 세 개 기업은 국내에서 SK텔레콤, NHN클라우드, 네이버, LG전자 등과 협력을 통해 일부 성과를 거둔 바 있지만, 더 많은 실증 사업을 통해 개발된 칩, 소프트웨어, 개발 환경 등을 종합적으로 평가해야 하고, 이를 바탕으로 해외 고객사를 확보해야 한다. 앞으로 큰 성과를 기대한다.

김용석 성균관대 전자전기공학부 교수