서울대병원, 국내 최초 '한국형 의료 거대언어모델(LLM)' 개발

"86.2%의 정확도…실제 의사 평균 정확도 뛰어넘어"

한국형 의료 LLM 임상 적용을 위한 프로젝트(서울대학교병원 제공)
한국형 의료 LLM 임상 적용을 위한 프로젝트(서울대학교병원 제공)

(서울=뉴스1) 강승지 기자 = 서울대학교병원은 최근 국내 최초로 '한국형 의료 거대언어모델'(LLM, Large Language Model)을 개발했다고 21일 밝혔다.

이 모델은 서울대병원의 전자의무기록(EMR), 의료영상저장전송시스템(PACS), 디지털병리시스템, 유전체 데이터 등 대규모 의료 데이터를 활용해 개발됐다.

한국의 의료 시스템에 특화된 의료 정보를 처리하고 진료 효율성을 높이며, 환자 안전을 강화하는 기술적 진전을 이뤘다고 병원은 강조했다.

병원은 이 모델을 통해 글로벌 의료 분야에서 경쟁력 있는 기술을 선도하고, 환자들에게 더 나은 의료 서비스를 제공할 수 있는 기반을 마련할 계획이다.

전 세계적으로 OpenAI의 ChatGPT(챗GPT) 등 거대언어모델에 대한 연구와 개발이 활발히 진행되고 있다.

그러나 기존 의료 LLM 모델들은 주로 서구권의 의료 지식에 최적화돼 있고, 한국어로 된 의료 텍스트나 한국의 의료법 및 진료지침 등을 이해하지 못하는 한계가 있었다.

병원은 이런 동향에 맞춰, 한국어와 영어를 혼용하는 국내 의료진 요구를 충족하고, 전문의 수준의 의학 지식과 약어·줄임말 등을 이해하는 LLM 개발의 필요성을 절감했다.

지난해 3월부터 병원은 한국형 의료 거대언어모델(LLM) 개발에 착수했다.

병원 내 입원초진, 외래기록, 수술·처방·간호기록 등 3800만 건의 임상 텍스트를 활용해 '한국어 의료 텍스트 말뭉치'를 구축했다.

이후 이를 개인정보 가명화 및 비식별화 후 병원 내에서 안전하게 활용할 수 있도록 공개했다.

이 텍스트 말뭉치는 모델 학습의 기초 데이터로 활용돼, 한국 의료 시스템에 맞는 정보 처리 능력을 키우는 데 중요한 역할을 했다.

병원은 올 들어 이 모델을 더욱 발전시켜 한국의 의료 관련 법률, 국문 논문 초록, 학회 진료 지침 등을 통합하고, 의학용어 약어 사전과 용어 표준화 작업을 진행했다.

이를 통해 실제 진료 프로세스를 모방한 각 진료과 특화 지시훈련 데이터셋을 구축했다. 또 지식그래프 기반 검색생성(RAG) 및 다학제 멀티 에이전트 프레임워크를 개발했다.

이런 과정을 통해 병원 내에서 실용적으로 활용할 '한국형 의료 거대언어모델(LLM)'을 1년 만에 완성했다.

병원은 모델의 성능과 안전성을 검증한 후, 병원 내 연구 및 업무 보조에 활용할 예정이다.

이 모델은 한국의사국가고시 최근 3개년 데이터 대상으로 실험을 진행한 결과, 86.2%의 정확도를 기록하며 오픈소스 모델 중 최초로 실제 의사 평균 정확도(79.7%)를 뛰어넘었다.

아울러 병원은 향후 LLM의 성능을 고도화해 실제 진료 현장에서 활용할 수 있도록 발전시킬 예정이다.

이를 위해 의료 영상과 생체 신호 데이터를 결합한 멀티모달 AI로 확장해 각종 프로젝트로 추진한다.

이런 프로젝트들은 의료진의 번아웃을 줄이고 업무 효율성을 크게 향상할 것으로 병원 측은 기대하고 있다.

개발을 주도한 이형철 교수(헬스케어AI연구원 부원장)는 "LLM 기술은 의사들의 업무를 돕는 중요한 도구가 돼, 의료 서비스의 질을 한층 향상할 수 있을 것"이라고 말했다.

김영태 병원장은 "이번 한국형 의료 거대언어모델 개발을 통해 의료 혁신의 새로운 장을 열었다. 앞으로도 지속해서 최신 기술을 도입할 것"이라고 강조했다.

ksj@news1.kr

대표이사/발행인 : 이영섭

|

편집인 : 채원배

|

편집국장 : 김기성

|

주소 : 서울시 종로구 종로 47 (공평동,SC빌딩17층)

|

사업자등록번호 : 101-86-62870

|

고충처리인 : 김성환

|

청소년보호책임자 : 안병길

|

통신판매업신고 : 서울종로 0676호

|

등록일 : 2011. 05. 26

|

제호 : 뉴스1코리아(읽기: 뉴스원코리아)

|

대표 전화 : 02-397-7000

|

대표 이메일 : webmaster@news1.kr

Copyright ⓒ 뉴스1. All rights reserved. 무단 사용 및 재배포, AI학습 활용 금지.