늘어나는 피부 질환 진단 인공지능…유색인 한계론 대두

발행날짜: 2024-03-08 05:30:00
  • 상용 제품 15개 조사 결과 유색인 유효 데이터 30% 불과
    데이터 수집 및 라벨링부터 공백 "데이터 다양성 확보 필요"

인공지능(AI) 기술의 발전으로 다양한 웨어러블 기술 등을 활용해 피부 질환을 진단하는 의료기기가 늘고 있지만 유색인 데이터가 반영되지 않아 정확도에 한계가 있다는 지적이 나왔다.

기계학습이나 딥러닝 과정부터 유색인 데이터가 현저하게 적어 인공지능이 절름발이가 되고 있다는 것. 따라서 조속히 이에 대한 보완책을 마련해야 한다는 것이 전문가들의 의견이다.

피부 질환 진단 인공지능이 유색인들에게는 정확도가 크게 떨어진다는 연구가 나왔다.

현지시각으로 7일 세계피부과학회지(International Journal of Dermatology)에는 피부 질환 진단 보조 인공지능의 한계성에 대한 연구 결과가 게재됐다(10.1111/ijd.17076).

현재 인공지능 기술의 발달로 CT나 MRI 등 영상 정보를 넘어 웨어러블 등과 결합해 일상 생활에서 비침습적으로 상시 검사를 진행할 수 있는 의료기기가 지속적으로 상용화되고 있다.

피부과 질환도 마찬가지. 피부에 간단히 접촉하거나 피부 사진을 찍는 등의 방법으로 피부암을 포함해 다양한 질환을 사전 진단할 수 있는 인공지능이 속속 나오고 있는 상황.

하지만 일부 의료기기가 유색인종에 대해 진단 오류를 일으키는 등의 문제가 발생하면서 이에 대한 비관론도 만만치 않은 상태다.

럿거스대학 투민텅(Thu Minh Truong) 교수가 이끄는 연구진이 현재 활용되고 있는 인공지능 기반 피부 질환 진단 보조 의료기기를 대상으로 이에 대한 분석에 들어간 것도 이러한 배경 때문이다.

실제로 상용 제품들이 유색인에게도 제대로 작동되는지, 그렇지 않다면 이유가 무엇인지를 파악하기 위해서다.

이에 따라 연구진은 2013년부터 2023년까지 개발된 피부 질환 진단 인공지능 15개와 이에 대한 임상 논문을 모두 분석했다.

습진부터 탈모, 피부암 등 모든 질환에 대한 인공지능을 사실상 전수조사한 셈이다.

그 결과 실제로 상용화된 인공지능 중 유색인에게 임상과 유사한 결과는 내는 제품은 30%에 불과했다. 나머지 제품들은 유색인의 경우 제대로 진단하지 못했다는 의미다.

그렇다면 이러한 이유는 무엇일까. 결론적으로 데이터 수집과 학습 과정에서 공백이 나타났기 때문이다.

인공지능을 개발하는데 필요한 데이터에 유색인에 대한 데이터가 아예 빠져있거나 극소수에 불과해 이에 대한 학습 자체가 되지 않았다는 의미다.

실제로 연구진이 이러한 인공지능을 검증하기 위한 연구를 살펴본 결과 10개 중에서 유색인 데이터가 들어가 있는 것은 마찬가지로 30%에 불과했다.

결국 나머지 연구들은 백인 데이터를 학습시키고 백인에게 적용하는 임상을 적용했다는 뜻. 이러한 이유로 유색인들에게는 정확도가 크게 떨어지는 결과가 나타난 셈이다.

이에 따라 연구진은 인공지능의 범용성을 확보하기 위해 피부 질환 제품을 개발할 경우 유색인 데이터를 필수적으로 넣어야 한다고 지적했다.

또한 이를 위해 양질의 유색인 피부 데이터를 구축할 필요가 있다고 강조했다.

투민텅 교수는 "일부 인공지능 모델의 경우 피부암까지 높은 정확도로 잡아내지만 유색인들에 있어서는 정확도가 절반까지 낮아졌다"며 "인공지능의 학습과 개발 자체가 편향적으로 이뤄지고 있기 때문"이라고 지적했다.

이어 그는 "진단 정확도를 높이기 위해서는 양질의 유색인 데이터를 수집하고 이를 적극적으로 반영하는 노력이 필요하다"며 "그렇지 않는다면 지금까지처럼 절름발이 제품이 될 수 밖에 없다"고 밝혔다.

관련기사

의료기기·AI 기사

댓글

댓글운영규칙
댓글을 입력해 주세요.
더보기
약관을 동의해주세요.
닫기
댓글운영규칙
댓글은 로그인 후 댓글을 남기실 수 있으며 전체 아이디가 노출되지 않습니다.
ex) medi****** 아이디 앞 네자리 표기 이외 * 처리
댓글 삭제기준 다음의 경우 사전 통보없이 삭제하고 아이디 이용정지 또는 영구 가입이 제한될 수 있습니다.
1. 저작권・인격권 등 타인의 권리를 침해하는 경우
2. 상용프로그램의 등록과 게재, 배포를 안내하는 게시물
3. 타인 또는 제3자의 저작권 및 기타 권리를 침해한 내용을 담은 게시물
4. 욕설 및 비방, 음란성 댓글