과기정보연, 과학기술 특화 생성형 거대 언어 모델 '고니' 공개

생성형 언어 모델 고니(KONI) 심볼. (과기정보연 제공)/뉴스1
생성형 언어 모델 고니(KONI) 심볼. (과기정보연 제공)/뉴스1

(대전=뉴스1) 김태진 기자 = 한국과학기술정보연구원(KISTI)은 31일 새로운 버전의 과학기술 특화 생성형 거대 언어 모델(LLM) ‘고니’(KONI)를 공개했다.

고니는 지난해 12월 처음 개발한 모델에 비해 보다 향상된 성능을 보였고, 과학기술 관련 업무를 수행하는 누구나 사용할 수 있도록 공개됐다.

과학기술정보 전문 국가연구기관인 KISTI는 다양한 국가 과학기술 빅데이터를 지속적으로 수집·분석해 과학기술에 특화된 LLM 개발을 선도하고 있다.

이번 고니는 2가지 버전으로 구성됐는데 기존 모델보다 2배 이상의 과학기술정보를 포함하는 데이터를 활용해 학습했고 추론, 글쓰기, 이해 등 다양한 작업에서 성능이 크게 향상됐다.

특히 한국어 LLM에 대한 종합적인 사고력을 측정하는 LogicKor 벤치마크 리더보드에서 동일 크기 LLM 중 1위를 달성했다.

8B 모델 크기를 갖는 고니 LLM이 70B 이하 LLM 중 처음으로 LogicKor 점수 8점을 넘어선 8.21점을 기록함으로써 한국어 LLM 개발에 있어 새로운 이정표를 제시했다는 평가다.

KISTI 고니 LLM은 AI 데이터 공유·활용 서비스 AIDA 등에서 누구나 다운받아 활용할 수 있다.

KISTI는 LLM에서 일반적으로 발생하는 환각 현상을 최소화하기 위한 기존 정보 서비스 시스템이 보유한 데이터를 활용하는 검색 증강 생성 기술(RAG)을 보유하고 있다.

KISTI는 RAG 기술을 고니와 연계해 신뢰성이 향상된 질의응답 시스템을 개발했고, 과학기술 관련 법령, 규정, 지침을 대상으로 KISTI 내부에서 성능 검증을 통해 연구원들의 다양한 피드백을 수집, 추가 학습함으로써 KONI의 성능을 더욱 향상시켰다.

김재수 KISTI 원장은 "새로운 버전의 KONI를 통해 과학기술 및 산업 분야를 포함하는 다양한 분야에서 과학기술정보 유통과 분석 체계를 혁신적으로 개선하고, 연구자의 과학적 발견을 지원할 수 있는 에이전트 체계인 KONI 기반 자율 연구자 AI를 구축할 계획"이라고 말했다.

memory4444444@news1.kr