"한국형 첫 추론 AI, 딥시크 능가"…LG '엑사원 딥' 공개

美 캘리포니아 엔비디아 GTC서 '엑사원 딥' 오픈소스로 첫선
딥시크 5% 규모로도 최고 성능…수능 수학 94.5점

배경훈 LG AI연구원장(LG 제공)
배경훈 LG AI연구원장(LG 제공)

(서울=뉴스1) 최동현 기자 = LG AI연구원이 18일 인공지능(AI) 모델 '엑사원 딥(EXAONE Deep)을 오픈소스로 공개했다. 미국 오픈AI, 중국 딥시크 등 글로벌 추론 AI 모델들과 견줄 수 있는 한국형 추론 AI 모델이 첫 등장한 것이다.

LG AI연구원은 17일(현지시각)부터 21일까지 미국 캘리포니아 새너제이에서 열리는 엔비디아의 연례 개발자 콘퍼런스(GTC)에서 엑사원 딥을 발표했다.

엑사원 딥은 국내 AI 기술이 '에이전틱(Agentic) AI' 단계로 진일보했다는 점에서 의미가 크다. 에이전틱 AI는 스스로 가설을 세우고 검증하기 위해 추론하는 능동적 AI를 뜻한다. 이를 구현하려면 기존 '지식 AI'를 넘어선 '추론 AI'가 필요하다.

엑사원 딥 32B 성능 비교(LG 제공)
엑사원 딥 32B 성능 비교(LG 제공)

현재 전 세계적으로 미국의 오픈AI와 구글, 중국의 딥시크와 알리바바 등 파운데이션 모델(Foundation Model)을 보유한 소수의 기업만이 자체 추론 AI를 개발 중이다. 엑사원 딥은 이들과 경쟁할 수 있는 국내 첫 모델이다.

'엑사원 딥-32B'은 매개변수가 320억 개로 '딥시크 R1'(6710억 개 매개변수)의 5% 규모 매개변수만으로 미국·중국 모델들과 비교해 우수한 성능을 구현할 수 있다.

LG AI연구원은 글로벌 오픈소스 AI 플랫폼 허깅 페이스(Hugging Face)에 매개변수가 다른 3가지 '엑사원 딥'의 논리적 사고력과 문제해결 능력을 평가하는 다양한 성능 평가 결과를 공개했다.

엑사원 딥 수학 영역 성능 비교(LG 제공)

복잡한 수학 문제와 과학 문제 해결 능력에서 우수성을 입증했다. 엑사원 딥-32B는 한국어에 강점이 있는 엑사원 파운데이션 모델을 기반으로 하고 있어 2025학년도 수능 수학 영역에서 94.5점으로 최고점을 기록했다.

확률과 통계, 미적분, 기하 등 선택과목에서도 모두 1등급을 달성했으며, 수학 문제 해결 능력을 평가하는 지표인 수학(MATH)-500은 95.7점을 기록했다.

엑사원 딥 과학과 코딩 영역 성능 비교(LG 제공)

엑사원 딥-32B는 물리학, 화학, 생물학 등 박사 수준의 과학 추론 능력을 평가하는 지표에서도 우수한 성능을 보였다.

과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서 66.1점을 받아 매개변수 규모가 유사한 추론 AI 모델과의 경쟁에서 앞서는 결과를 기록했다. 코딩 능력을 평가하는 라이브코드벤치도 59.5점을 기록했다.

LG AI연구원은 엑사원 딥이 수학과 과학, 코딩 등 전문 분야 평가 지표에서 높은 성능을 보여 향후 기업이 필요로 하는 전문 분야뿐만 아니라 물리와 화학 등 과학 연구와 교육 현장에서 활용도가 높아질 것으로 기대하고 있다.

엑사원 딥-32B은 오픈소스 공개와 함께 미국의 비영리 AI 연구기관인 에포크 AI가 선정하는 주목할 만한 AI 모델(Notable AI Models) 리스트에 등재됐다.

엑사원 딥 경량 모델(7.8B) 성능 비교(LG 제공)

LG AI연구원은 경량 모델인 '엑사원 딥-7.8B'과 온디바이스 모델 '엑사원 딥-2.4B'도 오픈소스로 함께 공개했다. 경량 모델은 32B의 24% 크기인데도 성능을 95%까지 유지하며, 온디바이스 모델은 7.5% 규모임에도 성능이 86%에 달해 높은 경제성과 실용성을 동시에 갖췄다.

LG AI연구원 관계자는 "2월 국가인공지능위원회에서 열린 국내 인공지능 산업 경쟁력 진단 및 점검 간담회에 참석해 조만간 딥시크 R1급 모델을 오픈소스로 공개한다고 예고한 후 1달여 만에 엑사원 딥을 발표했다"며 "LG의 AI 기술의 핵심은 모델 크기를 크게 줄이면서도 성능을 유지하는 것"이라고 설명했다.

엑사원 딥 온디바이스 모델(2.4B) 성능 비교(LG 제공)

실제 경량 모델인 7.8B의 성능은 미국 오픈AI의 o1-mini의 성능을 상회했다. 온디바이스 모델인 2.4B도 동급 모델과의 성능 비교 평가에서 세계 최고 수준의 성능을 보였다.

온디바이스 모델의 경우 외부 서버와의 연결 없이 기기 내부에서 안전하게 데이터를 처리해 보안성과 개인정보 보호 측면에서도 강점이 있다.

LG AI연구원은 LG전자와 LG유플러스 등 LG 계열사들과 함께 모델을 고도화해 온디바이스 AI 시장을 주도해 나간다는 계획이다.

앞서 구광모 LG그룹 회장은 올해 신년사에서 "AI와 같은 첨단 기술을 일상에서 편리하게 사용할 수 있게 하여, 소중한 시간을 보다 즐겁고 의미 있는 일에 쓰는 새로운 라이프 스타일을 만들어 갈 것"이라고 밝힌 바 있다.

dongchoi89@news1.kr