과기정보연, 생성형 언어 모델 '고니' 개발

과학기술데이터 특화 출연연·공공기관서 활용 쉬워

생성형 언어 모델 ‘고니’ 심볼.(KISTI 제공)/뉴스1

(대전=뉴스1) 김태진 기자 = 한국과학기술정보연구원(KISTI)은 생성형 언어 모델 '고니(KONI)'를 개발했다고 20일 밝혔다.

고니는 과학기술데이터에 특화되고 출연연, 공공기관에서 활용이 쉬운 생성형 거대 언어 모델이다.

KISTI는 대형 언어 모델(LLM)에서 일반적으로 발생하는 환각 현상을 최소화하기 위해 기존 정보 서비스 시스템이 보유한 데이터를 답변 제공에 활용하는 검색 증강 생성 기술 적용에 쉽도록 개발했다.

KISTI는 고니를 전산 비용, 보안, 정보 유출 등을 이유로 LLM 도입이 어려웠던 출연연, 공공기관, 중소기업에 지원할 예정이다.

또 모델 성능도 현재 130억 개 파라미터 수준의 모델 크기를 늘리고 학습 데이터도 추가 확보함으로써 지속적으로 향상할 계획이다.

김재수 KISTI 원장은 “KISTI는 출연연, 공공기관, 중소기업을 포함해 다양한 과학기술·산업 분야의 LLM 수요에 대응하고 외부 기관들과의 협력 체계 구축을 통해 지속적인 학습 데이터 확보 및 모델의 보급을 꾀하겠다"며 "사용자 피드백을 반영해 KONI 모델의 성능을 지속적으로 개선할 예정”이라고 말했다.

memory4444444@news1.kr