한글/영어 음성으로 치매 구분, 음성 기반 AI 한계에 도전
"언어 종류와 관계없이 범용적으로 적용할 수 있어"
가톨릭대학교 가톨릭중앙의료원 기초의학사업추진단의 고태훈(교신저자, 가톨릭대학교 의과대학 의료정보학교실) 교수, 김동민(제1저자, 가톨릭대학교 의과대학 의료정보학교실 연구교수) 교수 연구팀이 한글과 영어에 모두 대응이 가능한 음성 기반 치매 분류 인공지능을 개발했다.
환자의 인지장애 정도 분류를 위한 음성 기반 인공지능을 개발하는 경우, 언어의 종류별로 인공지능을 개발하는 경우가 대부분이다. 그러나 언어의 종류별로 인공지능 학습 데이터셋(분석 또는 처리를 위해 함께 구성되고 저장된 데이터의 구조화된 모음) 수집에 한계가 존재하고, 다수의 개별 인공지능을 개발해야 하는 어려움이 있었다.
연구팀은 한글과 영어 음성 데이터셋을 활용해, 두 언어 모두 높은 수준으로 경도인지장애군과 치매군을 분류하는 인공지능 개발에 성공했다. 해당 연구에서는 경도인지장애군과 치매군의 한글/영어 음성을 주파수 형태로 변환한 멜 스펙트로그램(Mel Sepctrogram)을 이용해 다양한 딥러닝 모델들을 비교해 최적의 인공지능을 개발했다.
고태훈 교수는 "이번에 개발한 인공지능은 향후 각각의 언어 종류와 관계없이 범용적으로 적용할 수 있는 음성 바이오마커 기반 치매 진단 솔루션의 기초가 될 수 있다"라고 밝혔다.
한편, 이번 연구는 가톨릭대학교 가톨릭중앙의료원 기초의학사업추진단 인공지능뇌과학사업단의 지원을 받아 진행됐으며, 의료정보 분야 권위 있는 학술지인 Computers in Biology and Medicine (IF=7.0, 6% in JCR category 'biology') 2024년 9월 180호에 게재됐다.