정보광장

보기

제 목 [Vol.6 No.3] 의료정보학에서의 머신러닝의 응용과 문제
작성자 관리자 이메일 information@kics.or.kr
작성일 2016-09-20 (2016-09-20 수정) 조 회 930
내 용
 

의료정보학에서의 머신러닝의 응용과 문제


작성자: 이계민 (서울과학기술대학교 전자IT미디어공학과)

최근 머신러닝과 딥러닝 기술에 대한 관심이 많이 높습니다. 굳이 알파고를 예로 들지 않더라도 심심치 않게 관련 기사가 언론에 오르내리고 국내외 주요 기업들이 투자를 밝히고 있으며 개발자를 위한 다양한 워크샵이 열리고 있습니다. 특히 딥러닝 기술은 이미지 분류(classification)와 세그먼테이션(segmentation) 등의 분야에서 근래 괄목한 성과를 보여 주며 많은 연구자들의 관심을 받고 있습니다. 이에 머신러닝과 딥러닝은 컴퓨터 비전과 깊이 결부되어 연구되고 있으며 조금만 관심을 가지고 살펴 보면 국내외 학회에서 발표되는 여러 흥미로운 연구 결과를 볼 수 있습니다. 본 글에서는 이미 잘 알려져 있는 응용분야 외에 머신러닝과 딥러닝 기술이 어떻게 응용될 수 있는지 의료 분야를 중심으로 몇 가지 사례를 통해 간단히 소개하고자 합니다.

의료 분야에서는 머신러닝에서 큰 부분을 차지하는 예측(prediction)과 분류(classification) 기술에 많은 관심을 가지고 있습니다. 간단한 예로 환자의 상태와 랩 테스트 등을 바탕으로 암이나 특정 질병의 유무를 판단하는 것은 ‘분류’ 문제로 볼 수 있습니다. 혹은 특정 시술이나 치료가 그 환자에게 적합한 것인지 사전에 그 결과를 ‘예측’할 수 있다면 의료진이나 환자가 더 나은 방법을 선택하는데 도움이 될 것입니다. 이를 위해 머신러닝 기술은 기존에 축적되어 있는 임상 데이터를 이용하여 예측, 분류 ‘모델’을 ‘학습’시키게 됩니다.

이 같은 관점에서 관상동맥조영술과 혈관확장술(PCI) 이후의 사망률(mortality)과 이환율(morbidity)을 예측하는 문제를 예로 들 수 있습니다. PCI는 좁아진 심장의 혈관을 확장하는 시술로 상당히 안전한 것으로 알려져 있지만 간혹 부작용이 발생하기도 하며 드문 경우 사망에 이르기도 합니다. 미국의 경우 BMC2라는 기관을 통해 PCI 시술 전 환자의 심장 상태, 처방, 랩 테스트를 포함해 시술 결과에 대한 데이터를 수집하고 있으며 이를 통해 PCI 시술의 품질 개선에 이용할 수 있을 것으로 기대하고 있습니다.

하지만 이를 머신러닝 기술의 단순 응용으로만 볼 수 없는 다양한 문제가 있는데, 그 중 하나가 데이터의 비대칭입니다. 대부분의 머신러닝 알고리즘은 각 분류군의 크기가 50:50으로 비슷할 때 좋은 성능을 보입니다. 하지만 위의 PCI의 경우 사망률은 0.1%에 미치지 못하고 있어 환자 상태에 관계없이 항상 정상 판정을 내려도 99.9%에 이르는 정확도를 보이게 됩니다. 따라서 데이터의 비대칭을 고려한 새로운 알고리즘의 개발이 필요하게 됩니다.
Figure 1 BMC2 PCi 참여 병원 현황 (출처: http://bmc2.org/pci)



각 환자의 경과가 어떻게 될 것인지 예측하는 데에서 더 나아가 머신러닝 기술은 의료 품질 개선을 위해 이용되기도 합니다. 같은 종류의 치료방법이라고 하더라도 병원이나 의료진에 따라 시술 결과에 차이를 보일 수가 있습니다. 즉 어느 병원이 더 나은지 혹은 어느 병원의 의료 품질을 높일 필요가 있는지 알아 낼 수 있는 것입니다. 미국의 ACS NSQIP는 바로 이 부분에 중점을 가지고 다양한 외과 수술 결과에 대한 임상 데이터를 수집하고 있습니다.

하지만 여기에서 또 다른 문제 하나가 있는데 바로 데이터의 이질성입니다. 넓은 범위에 걸쳐 흩어져 있는 다양한 병원을 통해 모은 데이터를 한데 모아 만든 모델을 각 병원에 적용할 때 그 결과가 부정확할 수 있습니다. 바로 각 병원을 주로 찾는 환자들의 질병의 경중, 영양상태 등에서 많이 차이를 보이기 때문입니다. 훌륭한 의료진이 많아도 중증 환자가 많이 찾는 병원의 경우 사망률이 높기 마련이기에 의료 품질에 심각한 문제가 있다고 말하기 어려운 이치입니다. 따라서 이러한 데이터의 이질성에 대한 고찰이 접목된다면, 환자들은 자신에 맞는 병원을 선택하고 의료기관은 품질 향상에 도움이 되는 결과를 얻을 수 있을 것입니다.


Figure 2 ACS NSQIP (출처: http://www.facs.org)



이상에서 머신러닝 기술이 의료 영역에서 어떻게 응용될 수 있는지 몇 가지 사례를 통해 짧게 살펴보았습니다. 의료 분야에서는 의료 영상 이외에도 다양한 임상 데이터가 축적되고 있으며 이들이 머신러닝 데이터 분석 기법과 결합되었을 때 여러 의미 있는 결과를 낼 수 있을 것으로 전망됩니다. 마지막으로 머신러닝과 딥러닝에 관심을 갖고 공부하고 계시다면 본 글을 통해 자신의 분야에서 어떻게 활용할 수 있을지 생각해 보실 수 있는 계기가 되었기를 바랍니다.


 
첨부파일