오픈AI,‘GPT-5.4’공개,‘AI가 계획하고 직접 짠다’…’전문가수준’ 오픈AI,‘GPT-5.4’공개,‘AI가 계획하고 직접 짠다’…’전문가수준’
AI가 직접 프로그래밍 플랜을 짜고 코딩하는 이른바 ‘전문 개발자’수준의 인공지능(AI) 에이전트가 등장했다. 오픈AI는 6일 업계 최고 전문가로 불리는 수준의 전문 프로그래머 업무를 수행할수 있는... 오픈AI,‘GPT-5.4’공개,‘AI가 계획하고 직접 짠다’…’전문가수준’

AI가 직접 프로그래밍 플랜을 짜고 코딩하는 이른바 ‘전문 개발자’수준의 인공지능(AI) 에이전트가 등장했다.

오픈AI는 6일 업계 최고 전문가로 불리는 수준의 전문 프로그래머 업무를 수행할수 있는 인공지능(AI) 모델 ‘GPT-5.4’를 공개했다.

GPT-5.4는 챗GPT, 응용 프로그래밍 인터페이스(API), 코덱스(Codex) 등 오픈AI의 주요 제품 전반에 적용되는 가장 뛰어난 모델로, 추론 능력과 코딩 성능, 에이전트 기반 워크플로를 하나의 모델로 통합한 것이 특징이라고 오픈AI측은 설명했다.

GPT-5.4는 특히 GPT-5.3-코덱스의 업계 최고 수준 코딩 능력을 통합하면서 스프레드시트, 프레젠테이션, 문서와 같은 전문 업무 환경에서 다양한 도구와 소프트웨어를 활용하는 방식을 크게 개선했다.

AI 스스로 코딩 플랜을 짜고 각종 소프트웨어 도구를 통합해 산업계 최고 전문가수준의 업무성과를 만들어 낸다는 설명이다. 프로그래밍 기획부터 전체 플랜,플로우 등을 통합하는 톱클래스 개발자 수준의 퍼포먼스를 만들어낸다는 게 전문가들의 평가다.

실제 이번 모델은 복잡한 실제 업무를 보다 정확하고 효율적으로 수행할 수 있으며, 사용자가 원하는 결과를 얻기까지 필요한 반복 작업도 줄였다.

올해도 연간 23조원의 적자가 예상되는 오픈AI가 이번 GPT-5.4를 통해 구글과의 경쟁을 통해 얼마나 빠르게 시장점유율을 높여가면서 적자폭을 줄여나갈지 주목된다.

주요 벤치마크에서 의미있는 성능개선을 보인 것으로 나타났다. AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제 비교 중 83%에서 산업 전문가와 동등하거나 더 높은 수준의 결과를 보였다.

이는 GPT-5.2의 71.0%보다 크게 향상된 결과로, GDPval은 미국 GDP의 주요 산업을 대표하는 44개 직군의 업무 과제를 기반으로 모델의 실제 업무 수행 능력을 평가한다.

오픈AI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다고 설명했다. 투자은행의 주니어 애널리스트가 수행할 수 있는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%를 크게 넘어서 전문가 수준의 결과를 도출했다.

프리젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도와 함께, 모델의 사실 정확성이 크게 개선된 것으로 나타났다. 또한 GPT-5.4는 오픈AI가 코덱스와 API 환경에서는 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 조작,다양한 애플리케이션을 선택해 복잡한 작업 흐름을 처리한다.

GPT-5.4는 최대 100만 토큰의 컨텍스트를 지원해 장시간 작업을 실행,검증하는 에이전트 시스템 구축에도 최적의 성과를 만들어낸다는 게 오픈AI는 설명했다. 챗GPT에서 제공되는 GPT-5.4(GPT-5.4 씽킹)는 새로운 작업 방식도 도입했다. 모델이 답변을 생성하기 전에 작업 계획을 먼저 제시,사용자가 응답 생성 중에도 방향을 조정할 수 있다.

오픈AI는 이를 통해 추가 대화를 반복하지 않아도 원하는 결과에 보다 빠르게 도달할 수 있다고 밝혔다. 웹 기반 심층 조사 능력이 강화돼 여러 출처의 정보를 종합해야 하는 복잡한 질문에서도 더 정확하고 일관된 답변을 제공한다.

GPT-5.4는 대규모 도구 환경에서도 효율적으로 작동하도록 도구 검색(tool search) 기능을 도입했다. 이를 통해 필요한 도구를 더 정확하게 찾는 것은 물론 토큰 사용량과 응답 지연도 줄여 기존 모델보다 빠르다.

오픈AI는 “GPT-5.4는 GPT-5.2 대비, 동일한 작업과 복잡한 업무를 더 빠르고 효율적으로 처리할 수 있다”면서 “GPT-5.4를 통해 기업과 전문가들이 AI 에이전트를 활용한 새로운 업무 방식이 확산될 것으로 기대하고 있다”고 전했다.

No comments so far.

Be first to leave comment below.

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.