기초연-KAIST, 수학 모델 기반 인과관계 추정 방법론 개발
- 김태진 기자
(대전=뉴스1) 김태진 기자 = 국내 연구진이 인과관계 추정 정확도를 높인 새로운 방법론을 개발했다.
기초과학연구원(IBS)은 수리 및 계산 과학 연구단 의생명 수학 그룹 김재경 CI(Chief Investigator) 연구팀이 수학 모델을 기반으로 시계열 데이터의 인과관계를 추정하는 새로운 방법론을 개발했다고 26일 밝혔다.
이 기술은 복잡한 계산 과정을 없애 기존보다 빠른 속도로 추론이 가능하면서도 정확도는 획기적으로 높였다.
매 순간 다양한 데이터가 기록되고 있다. 이중 시간의 흐름을 기준으로 기록된 ‘시계열 데이터’는 일기예보와 경제 분야뿐만 아니라 의학 분야에서도 가치 있게 쓰인다. 입원 환자의 심전도 측정을 통해 심장 발작의 직접적인 요인을 찾는 것과 같이 인과관계를 추정하는 것이 대표적이다.
최근에는 스마트 워치 등 웨어러블 기기를 통해 일상에서 건강 데이터를 쉽게 수집할 수 있게 되면서 의학 분야에서 시계열 데이터 분석의 중요성이 더 커지고 있다.
일련의 방법들은 시계열 데이터가 비슷한 주기로 변화하는 동시성을 가지기만 하면 인과관계가 있다고 잘못 예측하는 경우가 많았다. 또 직접적인 인과관계와 간접적인 인과관계를 구별하지 못한다는 한계도 있었다.
이에 연구팀은 기존 방법론들의 한계를 모두 해결한 새로운 방법론 ‘GOBI'를 개발했다.
연구팀은 시계열 데이터가 일반적인 수학 모델로 표현될 수 있는지 확인하는 수학 이론을 만들고, 이를 토대로 정확한 수리 모델이나 복잡한 계산 없이도 시계열 데이터로부터 인과관계를 추정하는 방법론을 개발했다.
연구팀이 이 방법론을 인과관계 분석에 적용한 결과 세포 내 분자들의 상호작용, 생태계 네트워크, 기상 시스템 등 다양한 분야의 데이터에서 기존 방법론에 비해 월등한 성능을 보였다.
특히 동시성 및 간접적인 영향을 가지는 시계열 데이터에서도 인과관계를 성공적으로 추론했다.
또 GOBI를 통해 여러 오염 물질 중 이산화질소와 호흡기로 유입되는 부유 미립자(직경 10㎛ 이하의 입자)가 심혈관계 질환에 영향을 미친다는 것을 확인할 수 있었다.
김재경 CI는 “수학과 통계를 결합해 정확하면서도 다양한 시스템에 유연하게 적용할 수 있는 새로운 인과관계 추정 방법론을 개발했다”며 “사회 및 자연과학 분야에 걸쳐 두루 사용되는 인과관계 추정 연구에 새로운 패러다임을 제시할 것으로 예상된다”고 말했다.
한국과학기술원(KAIST) 학부생 박세호(제1저자)·하석민(제2저자) 학생이 참여한 이번 연구의 결과는 국제학술지 ‘네이처 커뮤니케이션스’ 온라인에 지난 24일 게재됐다.
memory4444444@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.