오픈AI, 최신 LLM 'GPT-5.4' 공개
2026.03.06 08:50
오픈AI는 최신 대규모언어모델(LLM) GPT-5.4를 공개했다고 6일 밝혔다.
GPT-5.4는 챗GPT, API, 코덱스 등 오픈AI의 주요 제품 전반에 적용되는 프론티어 모델이다. 추론 능력과 코딩 성능, 그리고 에이전트 기반 작업을 하나의 모델로 통합한 것이 특징이다.
GPT-5.4는 GPT-5.3 코덱스의 코딩 능력을 통합하면서 스프레드시트, 프레젠테이션, 문서와 같은 업무 환경에서 다양한 도구와 소프트웨어를 활용하는 방식을 개선했다. 이를 통해 복잡한 실제 업무를 보다 정확하고 효율적으로 수행할 수 있으며 사용자가 원하는 결과를 얻기까지 필요한 반복 작업도 줄였다.
성능 측면에서도 GPT-5.4는 주요 벤치마크에서 의미 있는 개선을 보였다. AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제 비교 중 83%에서 산업 전문가와 동등하거나 더 높은 수준의 결과를 보였다. 이는 GPT-5.2(71.0%)보다 크게 향상된 결과다. GDPval은 미국 GDP의 주요 산업을 대표하는 44개 직군의 업무 과제를 기반으로 모델의 실제 업무 수행 능력을 평가한다.
오픈AI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다. 투자은행의 주니어 애널리스트가 수행할 수 있는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%를 크게 상회했다. 프레젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도와 함께, 모델의 사실 정확성도 개선되었다.
또한 GPT-5.4는 오픈AI가 공개한 범용 모델 가운데 컴퓨터 사용 능력을 기본적으로 탑재한 최초의 범용 모델이다. 코덱스와 API 환경에서는 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 조작하고 여러 애플리케이션을 넘나들며 복잡한 작업 흐름을 수행할 수 있다. GPT-5.4는 최대 100만 토큰의 컨텍스트를 지원해 장시간 작업을 계획하고 실행하며 검증하는 에이전트 시스템 구축에도 적합하다. 이러한 기능은 웹 브라우징, 데스크톱 환경 조작, 멀티모달 이해 등 다양한 벤치마크에서도 높은 성능으로 확인됐다.
김태호 기자 teo@sedaily.com
[서울경제 관련뉴스]
이란사태 본 국내 전문가들 “호르무즈 해협 봉쇄 오래 못간다”
하메네이 급습 시점 알려준 앤스로픽…이란 자폭드론에도 AI 있었다[美-이란전쟁]
트럼프 “유가 보다 전쟁 중요” 조기종전 확률 78→28%[이태규의 워싱턴 플레이북]
“내가 산 카리나 포토카드가 짝퉁?”… 에스파·아이브 불법 굿즈 유통업체 덜미
이란 “美-이스라엘 미사일, 신생아 병동까지 타격”[美-이란전쟁]
중동 리스크 고조에 장중 유가 10% 급등…정부 “100조원+α 시장안정 즉각 투입”
“다들 월 400만원 받는다더니, 내 통장은 왜 이래?”...연봉 협상 끝나자 절반이 “이직할래”
“매일 5000보” 인증하니 금리가 年 10%까지…러너 모시기 나선 은행들
오늘 저녁에 꼭 봐야겠네...36년 만에 하늘에 뜨는 정월대보름 ‘붉은 달’
“하이닉스 들어갔는데 전쟁이라니”...연휴 직전 7조 넘게 샀다 떨고 있는 개미들
저작권 보호를 위해 본문의 일부만 표시됩니다.
원문 보기 →댓글 (0)
첫 번째 댓글을 작성해보세요!
gpt 5.4의 다른 소식
모든 소식을 불러왔습니다
