디지털병리 저장공간 문제 해법 나와…용량 최대 90%↓

발행날짜: 2026-01-22 11:51:04 수정: 2026-01-22 11:54:27
  • 서울성모병원ㆍ고려대 안암병원, 데이터 절감 AI 기술 개발
    진단 중요도 낮은 영역 고도 압축 통해 최대 90% 절감

최근 이미지 스캔 기반의 디지털 병리 진단 시스템이 임상 전반에 확대, 데이터의 보관과 처리가 중요한 화두로 떠오르고 있는 가운데 데이터 용량을 최대 90% 절감하는 기술이 개발됐다.

22일 가톨릭대학교 서울성모병원과 고려대학교 안암병원을 중심으로 하는 다기관 국제 연구팀이 최근 디지털 병리 이미지의 진단 정확도를 유지하면서도 데이터 용량을 현저히 줄일 수 있는 새로운 적응형(Adaptive) 압축 프레임워크를 개발했다고 밝혔다.

서울성모병원 병리과 이성학 교수ㆍ고려대학교 안암병원 병리과 안상정 교수 공동 연구팀 (제1저자 펜실베니아대학교 생물통계학과 이종현 박사)이 개발해 '아다슬라이드(AdaSlide)'라고 명명한 해당 기술은 최근 디지털 병리 진단이 확대됨에 따라 동반되는 만성적인 저장공간 문제 해결에 일조할 것이라는 평가다.

최근 이미지 스캔 기반의 디지털 병리 진단 시스템이 임상 전반에 확대되면서, 기존에는 슬라이드를 실물로 보관하기 위한 공간과 환경 문제가 이슈였다면, 이제는 병리 진단을 위해 요구되는 고해상도 이미지 데이터 관리가 병원의 큰 부담으로 떠오르고 있다.

A)훈련시키는 데 사용된 31개 암종 데이터셋. B) 이미지 처리과정 : 타일링 – CDA – 인코딩 – 디코딩 - 재구성. C) 13개의 병리 진단 작업에서 원본 대비 성능을 시각화한 스파이더 웹 차트 - 다양한 압축방식의 품질이 비교되어 있음 (바깥쪽으로 갈수록 높은 성능) - 파란색 선이 원본 (Baseline), 갈색 선이 Adaslide - Adaslide는 전 영역에서 고르게 높은 품질을 보였으며, 일부 영역에서는 원본보다 우수한 모습을 보였다.

디지털 병리 시스템을 도입한 병원에서는 환자 한 명당 약 3~4기가바이트(GB), 매년 수백 테라바이트(TB)의 데이터를 보관하기 위해 막대한 저장공간이 필요한 것으로 알려졌다. 또한 단순히 보관만 하는 것이 아니라 때로는 보관된 이미지를 재판독하는 경우도 있는 만큼, 판독 품질에 영향을 최소화하면서도 효율적으로 용량을 감소시키는 압축 기술에 대한 필요성이 제기돼 왔다.

그러나 이제까지 연구됐던 다양한 압축 방식들은 슬라이드를 전체를 일괄적으로 처리하는 과정에서 필수적인 세포 정보를 훼손하거나, 혹은 불필요한 배경 데이터까지 고화질로 저장하는 비효율성이 있었다. 연구팀은 이를 해결하고자 전체 슬라이드를 압축 처리하는 것이 아니라, 인공지능을 활용해 한 슬라이드 내에서도 단위 영역별로 다르게 처리하는 하이브리드 압축 플랫폼 '아다슬라이드(AdaSlide)'를 개발했다.

예를 들어 암세포가 밀집해 정밀한 진단이 필요한 영역은 원본 화질을 보존하고, 지방 조직이나 빈 배경처럼 진단적 중요도가 낮은 영역은 고배율로 압축하는 방식으로 학습된 인공지능(AI)으로 이미지를 자동 처리하는 방식이다. 병리 이미지 내에서 진단적 가치가 높은 영역과 그렇지 않은 영역 간의 '정보 불균형(Information Disequilibrium)'을 적절히 처리한다면 중요한 진단 부위의 이미지 품질저하를 최소화하면서도 용량 효율화를 이룰 수 있다는 것이다.

31개 암종을 포함한 '판캔서(PanCancer)' 데이터셋의 약 180만 개 패널 이미지를 활용해 학습된 '압축 결정 에이전트(Compression Decision Agent)'는 이미지 내의 각 영역을 분석해 압축 여부를 스스로 판단하며, 압축된 이미지는 이후 '기초 이미지 복원기'를 통해 분석 가능한 수준으로 복원이 가능하다.

13개의 다양한 병리 진단 과제(분류 및 분할)를 통해 성능을 검증한 결과, 해당 기술은 원본 이미지 대비 저장 용량을 65%에서 최대 90%까지 줄이면서도 진단 성능은 원본과 동등한 수준을 유지하는 것으로 나타났다. 특히 기존의 균일 압축 방식이 세포 경계를 불분명하게 만들어 분석을 어렵게 했던 것과 달리, 연구팀의 플랫폼은 정보 손실을 최소화해 정밀한 분석을 가능케 했다.

이를 검증하기 위해 병리 전문의 5명이 참여한 시각적 튜링 테스트(Visual Turing Test)에서는 원본 이미지와 아다슬라이드로 복원된 이미지를 구별해낸 비율은 56%에 그쳤을 뿐 아니라 통계적으로 유의하지 않았다. 이는 숙련된 전문의도 육안으로 차이를 느끼기 어려운 수준의 품질을 시사한 결과다.

또한 인공지능 비교판독 시뮬레이션 결과, 핵 분할 데이터셋 (SNOW, PanNuke), 분류작업 (NCT-CRC, MHIST, LI, SICAPv2) 등에서 아다슬라이드 결과물이 원본 대비 향상된 분석 성능을 제공하기도 했다. 이는 이미지 처리 과정에서 발생한 정보 이득 (Information Benefit)에 따른 것으로, 이미지 복원 과정에서 불필요한 노이즈가 감소하고 색상이 정규화되며 중요한 정보 위주로 데이터가 보존된 결과라는 설명이다.

무엇보다 이번 연구는 단순한 용량 압축을 넘어, 인공지능이 진단에 필요한 정보를 스스로 선별하고 보존한다는 점에서 의미가 있는 것으로 평가된다. 연구팀은 아다슬라이드를 개발하며, 병리 전문의가 실제 진단 시 집중하는 영역과 유사한 패턴으로 데이터를 처리하도록 구현했다. 중요도가 떨어지는 배경 영역은 과감히 압축하고, 진단 핵심 영역은 보존하는 방식으로 진단 품질 훼손을 최소화하면서도 한정된 스토리지 자원으로도 더 많은 환자의 데이터를 장기간 보관할 수 있게 돼, 향후 AI 의료 빅데이터 구축의 효율성을 크게 높일 것으로 기대된다.

이번 연구를 주도한 서울성모병원 이성학 교수는 "진단적으로 중요한 정보가 무엇인지를 인공지능이 스스로 판단하고 선택적으로 보존하는 기술은 의료 데이터의 '의미 기반 관리'라는 새로운 방향성을 제시하는 접근"이라며, "향후 대규모 병리 AI 학습 데이터 구축과 국제 공동연구 환경에서도 실질적인 효율성을 제공할 수 있을 것"이라 밝혔다.

공동 교신저자인 고려대학교 의과대학 안상정 교수는 "디지털 병리의 확산에 있어 가장 큰 걸림돌 중 하나인 데이터 저장 비용 문제를 진단 정확도 저하 없이 해결할 수 있는 기술적 토대를 마련했다"며 "향후 이 기술이 병원의 의료 데이터 관리 효율을 높이는데 일조하겠다"고 밝혔다.

이번 연구 성과는 저명한 국제 학술지 '네이처 커뮤니케이션즈(Nature Communications, IF 15.7)'에 게재됐다.

관련기사

병·의원 기사

댓글

댓글운영규칙
댓글을 입력해 주세요.
더보기
약관을 동의해주세요.
닫기
댓글운영규칙
댓글은 로그인 후 댓글을 남기실 수 있으며 전체 아이디가 노출되지 않습니다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글