인공지능 활용 워크플로우 개선 논문 48개 메타분석 결과
유의미한 효율 향상 근거 없어…일부는 오히려 업무 증가
의료 인공지능이 의료진의 업무 효율성을 개선한다는 수많은 연구가 나오고 있지만 이에 대해서는 여전히 근거가 크게 부족하다는 연구 결과가 나와 논란이 예상된다.
많은 연구에서 의사의 로딩을 줄여준다는 보고가 나오고 있지만 상당수가 이해상충(COI)이 있는데다 실제 메타분석에서는 유의미한 결과가 나타나지 않았기 때문이다.
현지시각으로 15일 국제학술지 NPI 디지털 의학(npj Digital Medicine)에는 의료 인공지능의 업무 효율성 향상에 대한 대규모 메타분석 연구 결과가 게재됐다(10.1038/s41746-024-01248-9).
현재 의료 인공지능은 전 세계적으로 가장 주목받는 분야로 특히 의료진의 업무를 크게 줄일 수 있다는 보고가 이어지면서 기대를 모으고 있다.
이로 인해 이미 영상의학을 필두로 병리학, 유전체학 등 데이터 집약적인 분야에서는 수많은 인공지능 솔루션이 임상 현장에 보급되며 활용도를 높이고 있는 것이 사실.
이에 맞춰 1년에 수만건의 인공지능 논문이 발표되며 이에 대한 근거를 제시하고 있다.
그러나 아직까지 실제로 의료 인공지능이 의료진의 업무 로딩을 줄이는지에 대한 메타분석은 드문것이 사실이다.
독일의 본 의과대학 마티아스 바이글(Matthias Weigl) 교수가 이끄는 연구진이 이에 대한 대규모 메타분석을 진행한 배경도 여기에 있다.
실제로 의료 인공지능이 의료진의 업무 로딩을 줄여주는지 그렇다면 얼마나 이를 감소시키는지를 확인하기 위해서다.
이에 따라 연구진은 의료 인공지능을 통한 워크플로우 개선, 업무량 감소 등을 보고한 1만 3756개의 논문을 검토한 뒤 주축이 되는 48개의 연구를 선별했다.
그 결과 이 논문 중 67%의 연구가 의료 인공지능을 도입한 뒤 의료진의 업무가 감소했다고 보고한 것으로 집계됐다. 반면 24.2%의 연구는 의료 인공지능이 업무 시간을 단축하지 못했다고 보고했다.
메타분석 결과는 어땠을까. 일단 CT와 관련한 연구를 메타분석한 결과 CT 이미지를 판독하는데 필요한 시간은 실험군과 대조군 사이에 아무런 차이가 없었다. AI를 활용하건 안하건 시간 차이가 없었다는 의미다.
내시경 등에 인공지능을 활용한 연구 또한 마찬가지였다. 이에 대한 메타분석 결과에서도 실험군과 대조군 사이에 유의미한 차이는 나타나지 않았다.
나머지 연구들도 마찬가지였다. 총 6개의 메타분석을 진행했지만 인공지능을 사용한 것과 그렇지 않은 그룹 사이에 유의미한 차이가 없는 것으로 분석됐다.
그렇다면 단일 연구에서 업무 시간을 크게 줄여준다는 결과들은 어떻게 나오게 된 것일까. 연구진들은 연구 설계 및 기술간의 이질성과 이해상충을 지적했다.
실제로 의료 인공지능이 의료진의 업무 시간을 크게 단축한다는 연구의 55%는 기업과 관련한 이해상충을 보고했다. 기업의 후원으로 연구가 진행됐다는 의미다.
또한 연구의 설계와 기술, 임상이 100% 일치하는 연구는 48개 연구 중 단 1개에 불과했고 알고리즘의 출처나 개발자를 명시한 연구도 거의 없었다. 편향 등에서 자유로울 수 없다는 것이 연구진들의 지적이다.
카타리나 웬더롯 박사는 "현재 의료 인공지능이 보조 판독에 머무르는 경우가 많아 오히려 영상의학과 전문의가 자체적으로 판독을 마친 뒤에 AI에서 생성된 결과까지 확인해야 한다는 점에서 업무 시간이 늘어난다는 보고도 나오고 있다"며 "그러한 면에서 실제 신뢰할 수 있는 투명하고 명확한 연구들이 더 많이 진행돼야 할 필요가 있지만 크게 부족한 것이 현실"이라고 지적했다.
이어 그는 "특히 인공지능의 경우 알고리즘과 학습 방식이 매우 중요하지만 이를 명시한 연구는 거의 없었다는 점에서 알고리즘의 특성과 잠재적 편향을 파악할 수 있는 근거가 전무하다"며 "여전히 의료 인공지능이 의료진의 업무 효율성을 향상시키는지는 근거가 부족하다는 의미"라고 밝혔다.