“와주시면 보너스 1500억”…돈으로 승부 띄운 메타, 새 AI 성능이
2026.04.09 20:52
폐쇄형 AI ‘뮤즈 스파크’ 첫선
‘라마’ 실패 딛고 새 모델 공개
구글·오픈AI에 맞먹는 성능
AI 안경·SNS 적용해 차별화
‘라마’ 실패 딛고 새 모델 공개
구글·오픈AI에 맞먹는 성능
AI 안경·SNS 적용해 차별화
메타는 8일(현지시간) AI 모델 뮤즈 스파크를 공개했다. 알렉산더 왕 메타 최고AI책임자(CAIO)가 이끄는 메타초지능연구소(MSL)가 9개월에 걸쳐 개발한 메타의 첫 폐쇄형 AI 모델이다. AI 경쟁서 뒤처졌다는 평가를 받던 메타는 지난해 무려 1억달러(약 1480억원) 규모 보너스와 수억 달러 주식 보상을 제시하며 실리콘밸리 인재를 대거 영입한 바 있다.
메타는 “지난 9개월간 개발을 통해 기존 모델인 라마4 대비 10배 이상 적은 연산으로도 동일한 성능을 달성할 수 있게 됐다”며 “다른 최신 AI 모델과 비교했을 때 전반적으로 유사하거나 일부 영역에서는 앞선 성능을 보였다”고 설명했다.
메타 자체 테스트 결과 뮤즈 스파크는 차트 이해 능력을 측정하는 점수에서 86.4%를 받아 클로드, 제미나이, 챗GPT, 그록보다 높은 성능을 보였다. 이미지와 텍스트를 함께 이해하는 멀티모달 평가에서도 80.4%를 받으면서 제미나이와 GPT에 이어 세 번째로 높은 점수를 기록했다.
메타는 또 복잡한 문제를 해결하기 위해 여러 AI가 동시에 추론하는 ‘심사숙고(Contemplating) 모드’도 도입했다. 다수의 AI 에이전트가 병렬로 사고 과정을 진행해 정답을 도출하는 방식으로 고난도 추론 작업에서 성능을 끌어올리기 위한 기능이다. 메타는 이 기능을 통해 ‘제미나이 3.1 딥싱크’와 ‘GPT-5.4 프로’ 등 고성능 추론 모델과 경쟁할 수 있다고 설명했다.
다만 코딩 능력 지표에서는 경쟁 모델보다 낮은 점수를 받았다. 메타는 “코딩 영역은 아직 최상위 수준이 아니다”고 인정하면서 “코드 생성, 수정, 검증을 동시에 수행하는 멀티 에이전트 구조를 강화해 나갈 것”이라고 밝혔다.
AI 성능 분석기관 아티피셜애널리시스의 종합평가에서 뮤즈 스파크는 52점을 기록해 제미나이 3.1 프로 미리보기(57점), GPT-5.4(57점), 클로드 오퍼스 4.6(53점)에 이어 4위를 차지하면서 상위권 경쟁에 진입했음을 알렸다. 앞서 메타가 공개한 ‘라마4 매버릭’이 18점에 그쳤던 것과 비교하면 큰 폭의 개선이다.
메타는 “개발 과정에서 얻은 데이터를 기반으로 더 큰 규모 모델을 개발하고 있다”며 “향후 인간 수준을 넘어서는 AI를 기반으로 개인 비서형 에이전트를 구축해 10억명 이상 사용자에게 서비스를 제공하겠다”고 밝혔다. 이날 메타 주가는 전날보다 6.5% 상승했다.
저작권 보호를 위해 본문의 일부만 표시됩니다.
원문 보기 →댓글 (0)
첫 번째 댓글을 작성해보세요!
메타의 다른 소식
모든 소식을 불러왔습니다
