네이쳐지에 전문의 및 일반의와 진단 정확도 비교 결과
진단 정확도 86%로 전문의 상회…외부 의뢰도 63% 감소
인공지능이 진단 정확도면에서 이미 전문의를 능가하는 것은 물론 이러한 성능을 기반으로 판독 의뢰나 오진율도 크게 낮춘다는 연구 결과가 나왔다.
단순히 의사의 진단을 보조하는 수준을 넘어 그 이상의 일을 해낼 수 있다는 것. 이에 따라 전 세계적인 문제인 전문의 부족 문제의 매우 중요한 열쇠가 될 수 있다는 것이 전문가들의 의견이다.
현지시각으로 3일 국제학술지 네이쳐(Nature Medicine)에는 초음파 판독을 통한 난소암 진단에 있어 인공지능 모델의 효용성에 대한 대규모 연구 결과가 공개됐다(10.1038/s41591-024-03329-4).
현재 난소암은 전 세계적으로 여성의 주요 사망 원인으로 꼽히지만 국가별, 지역별 전문의 공급의 차이로 치료 및 완치율에 큰 차이를 보이고 있는 것이 사실이다.
초음파를 통해 난소암을 진단할 수 있는 전문의가 크게 부족하다는 점에서 전문가가 부족한 곳에서는 진단 지연이나 누락 등의 문제가 생겨나고 있는 셈이다.
이에 대한 대안 중 하나로 꼽히는 것이 바로 진단 인공지능이다. 만약 인공지능이 빠르고 정확하게 질환을 진단할 수 있다면 전문의가 부족한 지역에서도 진단 지연을 막을 수 있기 때문이다.
그러나 이에 대한 검증은 아직 부족한 것이 사실이다. 일부 연구에서 인공지능이 전문의 수준으로 진단할 수 있다는 보고가 있었지만 데이터가 한정적인 이유다.
스웨덴 카롤린스카연구소 엘리자베스 엡스테인(Elisabeth Epstein) 교수가 이끄는 연구진이 다국가, 다기관 데이터를 기반으로 인공지능을 학습시킨 뒤 검증 연구를 진행한 배경도 여기에 있다.
실제 이러한 문제를 해결할 수 있는 인공지능을 개발하고 이에 대한 임상적 근거를 확보하기 위해서다.
이에 따라 연구진은 세계 최대 난소암 후향적 연구인 'OMLC-RS'을 통해 8개국 20개 의료기관에서 3652명의 환자에게 얻은 1만 7118개의 초음파 이미지 데이터를 통해 신경망 모델을 개발했다.
또한 2660명의 환자 데이터를 기반으로 이 인공지능과 66명의 의사간에 진단 성능을 비교 분석했다.
그 결과 이 인공지능은 진단 정확도 86.3%를 기록해 10년 이상의 전문의 82.6%, 일반의 77.7%를 크게 상회했다.
민감도를 비교해도 이 인공지능 모델은 89.31%를 기록해 10년 이상의 전문의 82.40%보다 높았고 특이도 또한 인공지능은 88.83%, 10년 이상의 전문의는 82.67%를 기록했다.
사실상 모든 면에서 이 인공지능이 전문의의 수준을 넘어섰다는 의미가 된다.
이를 통해 이 인공지능 모델은 추가적으로 판독 등 의뢰를 크게 줄이고 오진율도 낮추는 것으로 나타났다.
같은 사례를 두고 인공지능과 전문의간 이를 비교하자 인공지능을 사용했을때 의뢰 건수는 무려 63%가 감소했으며 오진율 또한 18%나 줄어든 것으로 확인됐다.
엘리자베스 엡스테인 교수는 "이 인공지능 모델을 활용하면 전문의의 부담을 크게 줄여주는 동시에 일부 국가와 지역에서 일어나고 있는 진단 지연 문제를 획기적으로 해결할 수 있을 것"이라며 "특히 의뢰와 오진율을 크게 줄인다는 점에서 병원 인프라를 최적화하는데도 큰 도움이 될 것"이라고 밝혔다.