김화종 제약바이오협회 AI 신약융합연구원장 지적
"신약개발 단계별 사용 가능…시험·분석 등 비용 절감"
정부와 제약산업계가 '연합학습 기반 신약개발 플랫폼' 구축을 성공하기 위해서는 더욱 적극적인 관심과 참여가 필요하다는 주장이 나왔다.
18일 한국제약바이오협회 김화종 AI신약융합연구원장은 '연합학습 기반 신약개발 플랫폼 FDD'이라는 리포트를 KPBMA FOCUS를 통해 이같이 지적하고 이에 대한 관심을 촉구했다.
최근 AI를 활용한 신약개발에 대한 관심이 높아지면서 글로벌은 물론 국내에서도 다양한 시도가 진행되고 있다.
실제로 지난 2023년 3월 글로벌 회사인 엔비디아(NVIDIA)가 신약개발에 뛰어들면서 신약개발을 위한 생성형 AI 플랫폼 'BioNeMo'를 소개한 이후, 이와 유사한 것들을 모두 다 적용하기 위해 미국의 주요 제약 회사들이 진행 중이던 파이프라인들을 멈추고 AI가 도출하는 결과를 보고 파이프라인 순위를 바꾸려고 할 정도로 AI의 파급력이 커지고 있e.
이에 국내에서도 이를 위한 사업을 추진했고, 지난 3월 한국제약바이오협회 AI신약융합연구원은 '연합학습 기반 신약개발(Federated Learning based Drug Discovery, 이하 FDD) 가속화 프로젝트' 사업에 최종 선정되어 4월부터 세부 과제 기획, 공모·선정 등 본격적으로 추진할 예정에 있다.
이에 김화종 연구원장은 해당 연구의 목적은 '신약개발을 위한 AI 모델 학습에 필요한 데이터를 기관 간에 안전하게 공유할 수 있는 플랫폼을 확보하는 것'이라고 밝히고 앞으로 진행될 추진 전략과 이를 통한 기대 효과 등을 공유한 것.
우선 추진 전략을 살펴보면 △연합학습 실용성 입증 △데이터 기여도 평가 △데이터의 다양성 확보 등으로 진행된다.
이는 해당 FDD 사업에서 가장 중요한 목표는 연합학습의 실제 현장 적용을 확인하고 향후 확대 가능성을 입증하는 것인 만큼 1차년도에는 세부 사업별 구체적인 목표 설정과 연구개발 범위를 상세하게 설계하고 2차년도 이후에는 FDD 플랫폼을 구축하고 FLAP 동작을 확인하며 이의 고도화 및 확산을 추진할 예정이다.
김화종 원장은 특히 “연합학습 실제 도입 시 가장 큰 이슈는 자신이 보유한 모델 성능도 개선 되겠지만 공동의 모델 성능개선을 위해서 자신의 데이터를 활용하는 것에 대한 거부감”이라며 “이러한 문제를 피하기 위해서는 데이터 소유자에게 인센티브를 제공해야 하며, 예를 들어 활용된 데이터의 양과 질에 기반한 'AI 모델 개선 기여도'를 측정하고 이를 향후 정부 지원 사업이나 우수 AI 회사 발굴에 활용하는 전략이 필요하다”고 설명했다.
아울러 AI 모델의 성능을 높이기 위해서는 다양한 데이터가 필요하며 이를 위해 여러 기관의 참여와 협력이 중요한 만큼 제약 회사가 약물 후보물질 발견 단계에서 수행한 in-vitro 데이터뿐 아니라, in-vivo, 임상 진행 중 측정 된 약동학 데이터 보유기관과의 협력 전략이 필요하다는 점도 언급했다.
이에따라 데이터 소유자는 분석 목적 태스크(세부 ADMET 예측 등)를 협의해 선정하며, FLAP을 구성하는 베이스라인 AI 모델 개발에 필요한 데이터를 공급하도록 할 예정이다.
또한 모델 공급자는 FLAP를 구성하는 베이스라인 AI 솔루션을 개발하고, 이의 성능을 FDD로 검증하며 고도화하고, 플랫폼 개발자는 안전한 데이터 활용과 편리한 사용자 인터페이스를 개발해 연합학습 참여와 기여도를 산정하는 시스템을 구축할 방침이다.
이를 통해 향후 △ADMET 모델 활성화 △신약개발 단계 적용 및 확장 △글로벌 협력 활용 등이 가능할 것으로 내다봤다.
구체적으로는 현장에서 유용하게 사용할 수 있는 우수한 성능을 가진 ADMET 예측 모델을 개발하고 참여기관을 확대하고, 구축되는 플랫폼은 향후 신약개발의 여러 단계 즉, 타겟 발굴, 후보물질 탐색, 선도물질 최적화, 임상 설계, 시판 후 조사 등에 적용될 수 있다는 것.
나아가 글로벌 협력을 통해 FDD 참여자를 확대하고 플랫폼의 성능을 높이도록 하는 것까지가 목표다.
특히 성능이 개선된 ADMET 예측 모델 개발을 통해 시험 분석 비용을 절감할 수 있을 것으로 기대했다.
현재 2022년 국내 상장 제약 회사의 민간 신약개발 R&D 투자 비용은 4조 3,894억원6)이며, R&D 비용 중 ADMET 시험 분석에 약 9,656억원(북미·유럽 비율 22% 적용 시)이 소요된다.
즉 개선된 모델을 통해 20%의 비용을 절감하는 경우, 2022년 기준 R&D 비용 연간 1,900억원 이상 절감이 예상된다는 분석이다.
이에따라 해당 사업이 다양한 데이터를 활용하는 연합학습 기술을 확보하고, 민감 데이터 안전 활용으로 정보보호와 데이터 활용의 양립이 가능할 것이라는 주장이다.
여기에 ADMET 및 확대 적용으로 AI 기반 신약개발이 가속화 되고 데이터 소유·활용자 간 융합 촉진으로 산업 생태계의 선순환 체계 구축이 가능하다는 평가다.
이와 관련해 김화종 연구원장은 또 “최근 AI 기술의 발전과 보편화로 AI의 중요성에 대한 인식은 높아졌으나 AI의 성능을 높일 수 있는 다양한 데이터 확보에 대한 대책이 부재하다”며 “이에 FDD 사업을 통해 연합학습 기술을 현업 문제 해결에 적용되는 국내 최초의 성공 사례를 만들고자 하며 구체적으로는 최고의 성능을 얻는 네트워크 기반의 ADMET 예측 솔루션, FLAP을 구축하고자 한다”고 강조했다.
마지막으로 그는 “FLAP을 기반으로 AI 신약개발의 여러 단계인 타겟 발굴, 타겟 검증, 바이오마커 발굴, 유효물질 발굴, 선도 물질 최적화, 임상 설계, 효과 분석 등에서 FDD가 사용될 것으로 기대한다”며 “이와 관련된 산업계, 학계, 연구소, 병원 등 연구자들의 많은 관심과 참여가 필요하다”고 주장했다.