“삼성 떙큐” 엔비디아, 삼성이 만든 LPU로 AI 추론 효율 높인다
2026.03.17 07:57
“AI 에이전트 시대 도래”
2027년까지 매출 1조달러 넘을 듯
엔비디아가 연례 콘퍼런스 ‘GTC 2026’에서 빠른 추론에 특화된 언어 처리 장치(LPU)를 공개했다. 지난해 인수한 스타트업 ‘그록’이 개발한 칩으로, 삼성전자가 위탁 생산하고 있다. 엔비디아는 그래픽 처리 장치(GPU)와 LPU를 함께 사용해 추론 성능을 강화하고, 비용 대비 효율을 뜻하는 ‘토큰 경제성’을 높이겠다는 구상이다.
이날 젠슨 황 최고경영자(CEO)는 GPU 주문량이 2027년까지 1조달러에 달할 것이라고 전망하며 “에이전틱 AI가 다음 프런티어를 열 것”이라고 했다. AI 수요와 기업 가치가 과장됐다는 ‘AI 거품’ 논란에도 불구하고, 전 세계의 관심이 GTC에 쏠리면서 AI 수요에 대한 기대가 여전히 강하다는 평가가 나온다.
◇엔비디아, 빠른 추론 특화 LPU 공개
엔비디아는 16일(현지 시각) 미국 캘리포니아주 새너제이에서 연례 콘퍼런스 ‘GTC 2026’을 열었다. 엔비디아는 빠른 추론에 특화된 전용 칩인 LPU ‘그록3’를 공개하고, 이를 차세대 AI 수퍼컴퓨터 ‘베라 루빈’에 통합한다고 밝혔다. 그록3는 엔비디아가 지난해 200억달러를 주고 인수한 스타트업 그록이 개발한 칩으로, 올해 하반기 출하될 예정이다.
엔비디아가 두 칩을 통합한 이유는 추론 효율을 높이기 위해서다. 생성형 AI 모델은 방대한 데이터를 학습하는 단계와, 이를 바탕으로 이용자에게 답을 내놓는 추론 단계로 나뉜다. 학습에는 대규모 컴퓨팅 파워와 많은 GPU가 필요하지만, 추론 단계에서는 효율이 중요해 저비용·저전력 칩의 필요성이 커진다. AI 모델과 에이전트 발전으로 기업들이 업무 자동화에 AI를 본격 투입하면서, 학습보다 추론 성능이 더 중요해졌고 추론 효율을 높이는 것이 수익성의 핵심으로 떠올랐다.
GPU는 범용성과 생태계, 대규모 처리에 강한 반면, LPU는 언어 추론의 지연 시간과 예측 가능성 측면에서 강점을 갖는다. GPU가 식당 전체를 총괄하는 주방장이라면, LPU는 특정 요리에 특화된 전문 조리사에 가깝다. 두 칩을 함께 쓰면 성능과 효율을 모두 높일 수 있다는 게 엔비디아의 설명이다. 황 CEO는 이 같은 역할 분담을 통해 조 단위 매개변수를 가진 초대형 AI 모델의 추론 처리량을 35배 높이고, 저지연 추론 능력도 강화할 수 있다고 했다. 예를 들어 콜센터 AI에서는 GPU가 고객 정보 조회, 규정 검색, 복수 모델 동시 구동 등을 맡고, LPU는 상담원이 말하듯 즉각적으로 답변을 생성하는 역할을 할 수 있다는 것이다. GPU도 이 역할을 수행할 수 있지만, LPU보다 느리고 비용이 더 많이 든다.
황 CEO는 “이제 중요한 것은 누가 더 싸고 잘 추론하느냐, 즉 토큰 경제성”이라며 “우리가 토큰 왕이 되겠다”고 했다.
이 칩은 삼성전자 파운드리가 생산을 맡고 있다. 원래 그록이 엔비디아에 인수되기 전부터 진행하던 생산 계약을 이어받은 것이다. 황 CEO는 이날 기조연설에서 “삼성이 우리를 위해 그록3 LPU 칩을 제조하고 있고, 가능한 한 최대한 빠르게 생산을 늘리고 있다”며 “삼성에 감사한다”고 말했다. 이날 삼성전자는 새너제이 컨벤션센터에 전시관을 열고 LPU와 이 칩 생산에 쓰이는 웨이퍼를 공개했다.
엔비디아는 더 나아가 차세대 GPU, CPU, LPU, 네트워크, 스토리지까지 한 덩어리로 설계한 시스템인 ‘베라 루빈 플랫폼’ 구상도 처음 공개했다. 엔비디아는 지난 1월 CES에서 CPU ‘베라’와 GPU ‘루빈’을 탑재한 차세대 AI 가속기 ‘베라 루빈’을 공개한 바 있는데, 여기에 LPU까지 포함시키겠다는 것이다. 학습뿐 아니라 추론까지 강한 ‘AI 팩토리’를 만들겠다는 구상이다. 황 CEO는 “우리가 파는 것은 칩 한 장이 아니라 소프트웨어까지 붙은 거대한 통합 시스템”이라고 했다.
◇컴퓨팅 수요, 더 커질 것
황 CEO는 컴퓨팅 파워 수요가 앞으로도 계속 증가할 것이라고 전망했다. 그는 현세대 GPU인 블랙웰과 베라 루빈의 구매 주문 규모가 2027년까지 1조달러에 달할 것으로 예상한다고 밝혔다. 지난해 엔비디아가 제시했던 두 칩 매출 전망치 5000억달러의 두 배 수준이다. 황 CEO는 “다음 물결인 에이전트 AI 시대가 이미 왔다”며 “컴퓨팅 수요는 이미 통제 불가능할 정도로 커졌다”고 말했다.
AI 거품 논란에도 불구하고, GTC에는 전 세계의 관심과 이목이 집중됐다. 컴퓨팅 파워 수요가 지금과 같은 수준으로 계속 늘어날 것이라는 기대가 여전히 강하다는 점을 보여줬다는 평가가 나왔다. 특정 기업이 여는 콘퍼런스인데도 세계 최대 IT·가전 전시회인 CES 못지않은 관심을 끌며, 사실상 최대 AI 행사로 자리 잡았다는 반응도 나왔다. 미 금융 전문 매체 배런스는 “(AI 거품론을 주장하는) 월가의 마음을 바꿀 최고의 행사”라고 GTC를 소개했다.
실제 이날 오전 8시쯤, 기조연설이 시작되기 3시간 전부터 새너제이 컨벤션센터에는 긴 줄이 생겨났다. 컨벤션센터 주차장은 오전 8시 30분쯤 이미 만차가 됐다. GTC 2026 첫 행사인 기조연설은 1만8000명을 수용할 수 있는 경기장에서 열렸다. 로이터통신은 이번 행사를 “메가 콘퍼런스”라고 소개했다.
저작권 보호를 위해 본문의 일부만 표시됩니다.
원문 보기 →댓글 (0)
첫 번째 댓글을 작성해보세요!
gtc 2026의 다른 소식
모든 소식을 불러왔습니다
