[인텔 어게인 CPU] ② 급증하는 토큰비용 구원투수…남다른 '슈퍼클로' 광폭행보
2026.06.11 06:01
인공지능(AI) 패러다임이 거대언어모델(LLM)의 단순 '학습' 단계를 지나, 현실 세계에서 스스로 판단하고 작업을 수행하는 '에이전틱(Agentic)·피지컬(Physical) AI'의 실전 추론 단계로 급격히 진화하고 있습니다. 이에 따라 그동안 가속기(GPU)의 그늘에 가려져 있던 중앙처리장치(CPU)의 오케스트레이션 성능과 경제학이 새로운 핵심 변수로 급부상 중입니다. <디지털데일리>는 대만 타이베이 '컴퓨텍스 2026' 현장에서 포착한 인텔의 대반격 신호탄을 토대로, 칩 제조사를 넘어 '종합 AI 플랫폼 기업'으로의 체질 개선을 선언한 인텔의 하이브리드 생태계 전략을 통해 이를 조망해보고자 합니다. [편집자주]
[디지털데일리 김문기기자] 기업들이 단순한 AI 채팅 서비스를 넘어 스스로 판단하고 작동하는 '에이전트 중심의 워크플로우'로 빠르게 눈을 돌리고 있다. 하지만 기술의 화려함 뒤에 숨겨진 막대한 인프라 비용과 보안 리스크는 기업들의 발목을 잡는 장벽이다. 다단계 추론과 지속적인 데이터 검색에 의존하는 에이전틱 AI 특성상 컴퓨팅 자원 소비량이 기하급수적으로 늘어나기 때문이다.
실제로 글로벌 기업들의 AI 모델 API 지출은 지난해 35억 달러에서 2026년 현재 84억 달러로 폭발적으로 급증했다. 이 같은 상황에서 인텔은 비용과 데이터 보안, 확장성이라는 에이전트 기반 AI의 3대 난제를 한 번에 해결할 카드를 꺼내 들었다. 인텔의 AI 슈퍼 빌더(AI Super Builder) 팀이 독자 개발한 하이브리드 에이전트형 AI 솔루션, ‘슈퍼클로(SuperClaw)’가 그 주인공이다.
◆ 클라우드 전용 대비 ‘토큰 소비량 70% 절감’…비용 경제학의 실현
인텔이 제시한 슈퍼클로의 핵심은 기업의 지출을 직접적으로 줄여주는 비용 효율성이다. 인텔에 따르면 슈퍼클로를 기존 클라우드 전용 에이전트 기반 AI 솔루션과 비교 테스트한 결과 엔터프라이즈 워크로드를 실행할 때 평균 클라우드 컴퓨팅 토큰 소비량을 최대 70%까지 절감하는 것으로 나타났다.
이러한 탁월한 비용 절감은 슈퍼클로만의 지능형 작업 라우팅, 컨텍스트 압축, 재사용 가능한 메모리 기술, 그리고 '로컬 우선 실행' 방식 덕분에 가능했다. 파일 액세스나 데이터 처리, 콘텐츠 생성처럼 보안이 중요하고 발생 빈도가 높은 반복 작업은 기기 내부(로컬)에서 우선 처리하고, 고도의 추론이나 외부 데이터 검색이 필요한 영역만 선택적으로 클라우드 모델에 넘기는 구조다.
최근 클라우드 컴퓨팅 단가가 지속적으로 상승하고 향후 비용 예측이 어려워지는 상황에서, 슈퍼클로는 기업들이 에이전틱 AI를 대규모로 배포할 수 있는 현실적인 돌파구를 마련했다는 평가를 받는다.
◆ 사내 방화벽 안에서 도는 데이터…개인정보 탐지 정확도 99%
비용 절감과 함께 슈퍼클로가 가진 또 다른 핵심 축은 ‘보안’이다. 슈퍼클로는 기본적으로 모든 민감 데이터를 기기 내 또는 기업 엣지 환경인 온프레미스(사내 구축형)에 보관한다. 데이터가 사내 방화벽 안에서만 구동되기 때문에 클라우드를 통한 기술 유출 우려가 차단된다.
어쩔 수 없이 클라우드로 작업을 전송해야 할 때도 개인정보 보호를 고려한 라우팅 및 데이터 최소화 원칙이 적용된다. 사전에 설정된 정책에 따라 승인된 필수 정보만 외부로 나가도록 통제하는 방식이다. 실제 업계 표준 AI 개인정보 보호 벤치마크 테스트에서 슈퍼클로는 개인식별정보(PII)를 99%의 정확도로 탐지(F1 스코어 95%)하며 높은 데이터 보호 역량을 입증했다.
보안 완성도를 높이기 위한 안전장치도 돋보인다. 컴퓨텍스 2026에서 인텔 측 데모 담당자는 "직원마다 개별 가상 컨테이너를 할당할 수 있다"며 "혹시나 AI 에이전트가 시스템 설정을 건드리거나 파괴적인 오류를 내더라도, 해당 가상 공간만 폭파하고 새로 만들면 되므로 사내 IT 보안에 매우 안전하다"고 설명했다.
매번 똑같은 답변만 반복하는 일반 코필럿과 달리, "어제 쓰던 코드 이어서 짜줘" 같은 사용자의 맥락과 업무 히스토리를 기억하는 진짜 개인화 비서 역할을 수행하면서도 보안성은 극대화한 셈이다.
◆ 아크 GPU 100% 활용하는 하드웨어 최적화…팬서 레이크서 35B 모델 로컬 구동
하드웨어와 최적화된 유기적 구동 방식 역시 눈길을 끈다. 슈퍼클로는 오픈클로(OpenClaw) 등 기존 오픈소스 플랫폼과 코드를 공유하지 않는 인텔만의 순수 독자 플랫폼이다. 특히 CPU를 거치지 않고 인텔 아크(Arc) 그래픽 카드의 성능을 100% 끌어내도록 양자화(Quantized)된 모델만을 사용한다.
컴퓨텍스 현장 시연에서는 4개의 아크 프로 B70 GPU를 탑재한 시스템을 통해 무려 800억 개(80B) 파라미터 수준의 거대 모델을 사내 로컬 서버에 설치해 두고, 상대적으로 성능이 낮은 노트북으로 내부 서버에 접속해 활용하는 '하이브리드 워크플로우' 데모를 구현해 내기도 했다.
더욱 고무적인 것은 차세대 프로세서인 ‘팬서 레이크(Panther Lake)’ 환경이 구축되면, 외부 서버의 도움 없이도 노트북 및 PC 자체에서 350억 개(35B) 규모의 모델을 직접 구동할 수 있게 된다는 점이다. 팬서 레이크가 탑재한 온디바이스 GPU 및 NPU 성능이 대규모 로컬 LLM을 감당할 수 있을 만큼 높아졌기 때문이다.
인텔은 이달말 슈퍼클로의 베타 버전을 다운로드 형식으로 최초 배포하고, 7월 정식 공개(GA)에 나설 계획이다. 이미 에이서(Acer), 에이수스(ASUS), 델(Dell), HP, 레노버(Lenovo), MSI, 파나소닉(Panasonic) 등 글로벌 PC 제조사들이 전폭적인 지지와 관심을 표명하며 컴퓨텍스 현장 부스에서 라이브 데모를 진행하기도 했다.
인텔 관계자는 "인텔은 슈퍼클로를 하이브리드 에이전트 플랫폼에서 완전한 에이전트 기반 운영체제(OS)로 발전시키는 것이 목표"라며 "기업의 핵심 통제권을 유지하면서도 토큰 비용과 성능, 데이터 보호 측면에서 차별화된 가치를 제공할 것"이라고 전했다.
저작권 보호를 위해 본문의 일부만 표시됩니다.
원문 보기 →