알피의 ECG 버디와 전문의 5명 분석 비교 연구 공개 예정
민감도와 특이도 등 정확도, 평가자간 일치율 등 의사 압도
우리나라의 현직 의대 교수가 만든 심전도(ECG) 분석 인공지능이 정확도와 평가자간 일치율 등에서 전문의 수준을 앞질러 이목이 집중되고 있다.
ECG를 통해 고칼륨혈증을 진단하는데 있어 응급의학과 전문의들보다 정확도 면에서 앞선 것. 결론적으로 임상현장에서 충분히 활용가능하다는 것이 전문가들의 평가다.
오는 11월 20일 대한의학회 국제학술지 Journal of korean medical science에는 초기 심전도를 활용한 고칼륨혈증 진단에 있어 인공지능의 효율성에 대한 연구 결과가 게재될 예정이다.
고칼륨혈증은 혈청 칼륨 수치가 정상 범위인 3.5~5.0mmol/L를 초과할때 발생하는 질환으로 부정맥이나 급작스런 심정지를 일으킬 수 있다는 점에서 초기 진단과 치료가 매우 중요하다.
이에 따라 현재 대학병원 응급실 등에서는 12리드 심전도를 통해 비침습적으로 이를 우선적으로 진단하는 것이 일반적인 접근 방식.
고칼륨혈증일 경우 심전도 상 T파가 매우 높고 QRS 복합체가 넓어지며 궁극적으로 P파가 소실되는 경우가 많다는 점에서 이러한 특이점을 통해 진단을 시도하는 셈이다.
그러나 이같은 심전도 변화가 초기 고칼륨혈증의 경우 매우 미묘한 변화만 있는데다 정량화하기 어렵다는 점에서 일정 부분 한계가 있는 것이 사실이다.
분당서울대병원 응급의학과 김중희 교수가 이끄는 다기관 연구진이 심전도 용지를 스마트폰으로 사진을 찍는 어플리케이션 방식으로 진행되는 알피(ARPI)사의 심전도 분석 인공지능 'ECG 버디(ECG Buddy)'에 대한 검증에 들어간 것도 이같은 배경이다.
만약 실제로 이같은 방식을 통해 고칼륨혈증을 정량적으로 진단할 수 있다면 잠재적으로 매우 유용한 옵션이 될 수 있는 이유다. 김중희 교수는 분당서울대병원 기술지주회사인 알피의 대표를 맡아 개발을 이끈 주역이기도 하다.
이에 따라 연구진은 고칼륨혈증으로 진단된 환자 64명과 그렇지 않은 환자 61명 등 총 125명을 대상으로 ECG 버디와 응급의학과 전문의 5명간 진단과 분석 결과를 비교했다.
그 결과 ECG 버디는 고칼륨혈증 진단에 있어 곡선하면적(AUCROC)가 0.902를 기록했다. 곡선하면적이 1에 가까울 수록 정확하다는 의미라는 점에서 상당한 정확도를 보인 셈이다.
반면 응급의학과 전문의 5명의 평균 곡선하면적(AUCROC)은 0.662로 상당히 낮은 수준을 기록했다. 정확도 면에서 인공지능 어플리케이션에 비해 크게 떨어졌다는 의미다.
다른 지표에서도 이같은 차이는 확연하게 드러났다.
실제로 ECG 버디는 민감도 0.797, 특이도 0.934, 음성 예측도 0.815, 양성 예측도 0.927로 상당히 높은 정확도를 보였다.
하지만 응급의학과 전문의 5명의 평균 민감도 0.203, 특이도 0.934, 음성 예측도 0.527, 양성 예측도 0.765로 마찬가지로 인공지능에 비해 크게 뒤쳐졌다.
환자별, 증상별 일치도 또한 차이를 보였다. Fleiss’ kappa를 비교하자 ECG 버디는 0.948을 기록한 반면 응급의학과 전문의들은 0.551에 그쳤던 것. 인공지능이 매우 균일한 진단을 해내는 반면 응급의학과 전문의들은 중간 정도 진단율을 보인다는 의미가 된다.
연구진은 고칼륨혈증이 매우 치명적인 심혈관 부작용을 가져올 수 있으며 응급실 내에서 명확하게 진단이 쉽지 않다는 점에서 이러한 높은 정확도를 가진 ECG 버디가 향후 유망한 옵션이 될 수 있을 것으로 내다봤다.
연구진은 "고칼륨혈증 진단에 있어 전문의 진단과 비교해 인공지능의 성능을 분석한 최초의 연구라는 점에서 매우 의미가 있다"며 "고칼륨혈증 스크리닝에 있어 인공지능의 높은 정확도와 신뢰성을 입증했다"고 설명했다.
이어 "특히 이 인공지능은 매우 저렴하며 심전도가 인쇄된 종이를 사진을 찍어 분석한다는 점에서 심전도 기기나 병원정보 시스템을 업그레이드할 필요가 없어 재정적 이점도 분명하다"며 "잠재적으로 고칼륨혈증 환자의 조기 진단을 위한 매우 유용한 옵션이 될 것"이라고 밝혔다.