"딥시크 대비 정확도 3배"…오픈AI, 전문가 AI '딥리서치' 출시

5분~30분간 분석해 전문가수준 보고서 도출
최고 난도 벤치마크서 'o3-미니'보다 정답률 2배

김민석 기자

2025.02.03 오후 03:11

오픈AI 연구원들이 '딥 리서치' 기능을 발표하고 있다.(오픈AI 유튜브 갈무리)

(서울=뉴스1) 김민석 기자 = 오픈AI가 3일 일본 도쿄에서 온라인 라이브 이벤트를 열고 심층 추론 인공지능(AI) 모델 '딥리서치'(DeepResearch)를 출시했다.

딥 리서치는 질의 한 번에 수많은 웹 자료를 종합·분석해 전문가 수준의 보고서를 생성하는 도구다. 우선적으로 챗GPT 프로(월 200달러) 구독자 대상으로 제공하며 월 최대 질문 한도는 100개로 제한된다.

오픈AI에 따르면 딥 리서치는 기존 챗GPT가 해결하지 못했던 복잡한 연구 과제를 스스로 웹을 탐색하며 필요한 정보를 찾아내고 다단계 분석을 수행한다. 이를 통해 O3보다 2배가량 뛰어난 정답률을 갖췄다고 회사 측은 설명했다.

딥리서치는 금융·과학·정책 등 전문 연구자들을 위한 심층 분석을 지원한다. 기존 챗GPT처럼 질문에 즉시 답변을 생성하지 않고 5분~30분 정도 검색·분석 과정을 거쳐 보다 정밀한 결과를 내놓는다.

오픈AI는 발표에서 딥리서치는 중국 스타트업 딥시크(DeepSeek)가 개발한 AI 모델 'R1' 보다 약 3배 높은 정확도를 갖췄다고 강조했다.

오픈AI 연구원은 "수백 개의 온라인 소스를 탐색해 연구자 수준의 포괄적인 보고서를 생성한다"며 "사람이 수 시간 걸려 수행해야 하는 작업을 단 몇십 분 만에 처리할 수 있다"고 말했다. 이어 "최신 o3 모델의 파인튜닝 버전을 기반으로 기존 'GPT-4' 대비 처리 속도를 약 50% 높이고 환각 오류(잘못된 답변) 발생률을 34% 정도 줄였다"고 전했다.

딥리서치는 AI 성능을 평가하는 가장 어려운 벤치마크 중 하나로 꼽히는 '인류의 마지막 시험'(Humanity's Last Exam) 정답률 25.3%를 기록했다. 이는 GPT-4o의 3.3%, 오픈AI의 기존 추론 모델 'O1'과 '딥시크 R1'의 9.1%·9.4%를 크게 상회하는 수치다.

오픈AI 연구원은 "언어학, 로켓 과학, 고전문학, 생태학 등 100개 이상의 주제에서 3000개 이상 객관식단답형 문제를 테스트했다"며 "화학, 인문학, 사회과학, 수학 등에서 높은 성과를 보였고 전문 정보를 탐색하는 방식도 인간과 유사한 접근법을 보여줬다"고 했다.

딥리서치는 △챗GPT 플러스(월 20달러) △팀(월 25달러) △엔터프라이즈(기업용) 구독자에게는 순차적으로 지원 예정이다.

한편 구글은 심층 추론 AI 서비스인 '딥 리서치'를 지난해 12월 공개한 바 있다. 구글의 딥 리서치도 복잡한 주제를 탐구해 보고서를 도출하는 형태다. 현재 '제미나이 어드밴스드' 이용자 대상으로 제공되고 있다.

ideaed@news1.kr

"딥시크 대비 정확도 3배"…오픈AI, 전문가 AI '딥리서치' 출시

많이 본 뉴스