검색 본문 바로가기 회사정보 바로가기

> 산업 > ITㆍ과학

AI의사 가르칠 '데이터'가 없다…수조원 쏟은 왓슨도 '위기'

미국 현지 IBM '왓슨 포 온콜로지' 회의론 부상
국내 AI 개발 병원·기업 데이터 확보 '첩첩산중'

(서울=뉴스1) 남도영 기자 | 2018-08-22 07:40 송고
IBM 왓슨 홈페이지 첫 화면. /뉴스1 © News1

미국 현지에서 세계 최초의 인공지능(AI) 의사 '왓슨'(왓슨 포 온콜로지)에 대한 회의론이 제기되고 있다. 암 치료의 새로운 미래를 열 것이란 기대와 달리 데이터 확보에 어려움을 겪으며 실제 진료 현장에서 제 역할을 못하고 있다는 지적이다. 한국에서도 정부와 병원, 기업들이 앞다퉈 의료 AI 개발에 나서고 있는 가운데, 아무리 똑똑한 AI도 정교한 데이터없이는 '속빈 강정'이 될 수 있다는 우려가 나온다.

22일 의료계와 외신보도 등에 따르면 최근 의학전문매체 STAT는 왓슨을 개발한 IBM의 내부문건을 근거로 "왓슨이 정확하지 않고 위험한 진단을 내린다"고 폭로했다. 이어 월스트리트저널(WSJ)은 "왓슨이 실제 환자에게 미치는 영향이 제한적이었다"고 평하며 이미 12개 기관이 왓슨과 관련한 암 치료 프로젝트를 중단하거나 축소했다고 보도했다.

전문가들은 왓슨이 만족할만한 치료법을 내놓지 못하는 이유로 '데이터 부족'을 꼽았다. 왓슨은 의사가 환자에 대한 정보를 입력하면 관련 문헌을 분석해 최적의 치료법을 찾는다. 이를 위해 의학논문과 교과서 등 1500만 페이지에 달하는 의료정보를 학습했고, 2012년부터 세계 3대 암센터 중 하나로 꼽히는 메모리얼 슬론 캐터링 암센터 의사들의 도움을 받아 진료정보를 습득하고 있다.

하지만 전문가들은 문헌자료와 연결할 실제 환자 데이터가 부족했다고 보고있다. 암 환자를 진료하기 위해선 개인 병력과 치료 결과, 과거 유사 환자 사례 등 다양한 데이터를 학습해야 하는데, 이런 데이터들이 각기 다른 형태로 여러 기관에 분산돼 있어 통합이 어려웠다는 지적이다. 또 특정 병원 의료진에게만 진료를 배우다보니 희귀암이나 재발암 등에 대한 다양한 데이터가 부족하고, 왓슨이 제시하는 치료법도 객관성이 떨어진다는 문제가 제기됐다.

IBM은 지금까지 왓슨을 학습시킬 데이터를 확보하기 위해 의료정보 관련 업체 인수합병(M&A)에만 약 50억달러(약 5조5000억원)을 쏟아부었다. 최근 언론보도에 대해 IBM 측은 의료 전문가들과 왓슨을 개선하기 위한 노력을 지속하고 미국 외 국가에 대한 현지화도 진행하겠다고 해명했지만, 천문학적인 투자를 감당할 수 있을지 의문시되고 있다. 미국 온라인 매거진 슬레이트는 "왓슨은 의학적이거나 기술적인 문제도 있지만 재무적으로도 심각한 상황"이라고 지적했다. 실제 올해 IBM은 왓슨 헬스사업부 직원들을 감원하는 구조조정을 실시하기도 했다.

왓슨이 겪고 있는 어려움은 국내에서 의료 인공지능을 개발 중인 병원과 기업들도 똑같이 맞닥뜨리게 될 가능성이 크다. 현재 국내에선 서울아산병원, 삼성서울병원, 서울대병원 등 대형병원을 중심으로 의료 AI 개발이 활발히 이뤄지고 있다. 또 올해 과학기술정보통신부는 2020년까지 357억원을 투입해 8개 질환을 대상으로 21개 지능형 소프트웨어를 개발하는 '닥터앤서' 사업을 시작했다. 이 사업엔 25개 의료기관과 18개 기업 등이 참여한다.

AI 개발 속도에 비해 데이터 확보는 아직도 걸음마 수준이다. 국내에선 개인정보보호법과 생명윤리법 등에 막혀 의료정보가 병원 담장을 넘기 어렵다. 병원 내에서도 임상시험심사위원회(IRB) 승인을 받아 연구용으로만 활용할 수 있다. 병원별로 각기 보유한 데이터를 표준화하고, 빅데이터로 정제·통합해야 하는 과제도 남아있다. 최근 닥터앤서 사업과 관련해 열린 세미나에서 윤형진 서울대 의과대학 교수는 "공공기관과 병원에 쌓아놓은 데이터는 많지만 서로 연계가 안될 뿐더러 설령 표준화를 해도 실제 활용할만한 질좋은 데이터는 거의 없다"고 지적하기도 했다.

병원에서 AI를 개발 중인 의료계 한 관계자는 "AI 기술을 개발해도 양질의 데이터를 투명하게 활용할 수 있는 기반을 마련하지 못하면 실제 진료에 적용할 수 있을만한 수준까지 만들기 어렵다"며 "특히 데이터의 연결성이 중요한데, 양보다도 질적인 측면이나 전처리 기술 등이 관건"이라고 말했다.


hyun@