가입자 100만명 정보 축적…"개인정보는 제외, 공익연구에 제공"
100만명의 건강정보가 담긴 빅데이터를 앞으로 각종 보건의료 관련 연구에 이용할 수 있게 된다.
국민건강보험공단은 가입자의 진료내역, 검진결과, 요양기관정보 등을 바탕으로 층화계통추출방법을 통해 연구용 표본 데이터베이스(DB)를 구축했다고 22일 밝혔다.
층화계통추출은 조사할 집단을 동일한 몇 개의 층으로 나누고 층화된 집단에서 각각 일정 규모의 표본을 추출하는 방식이다. 예를들어 연령은 5세 단위로 구분해 각 집단에서의 표본을 추출한다는 것.
이번 DB는 지난해 7월부터 6개월간 고려대 의대 이준영 교수팀의 연구결과를 바탕으로 구축했다.
구축된 자료는 ▲성별, 연령별, 소득분위별 등으로 구분해 추출된 '표본코호트DB' ▲크론병 등 3개 희귀질환을 대상으로 하는 '희귀질병DB' ▲2001~2010년 5번의 건강검진을 모두 받은 수검자 240만명를 대상으로 하는 '건강검진DB' 등 총 3가지 종류다.
여기에는 2002~2010년 개인정보를 제외한 진료내역, 검진결과 등의 건강상태, 사망까지의 내용 등이 들어있다.
건보공단은 "지금까지 자료규모의 방대함과 개인정보보호 문제 등으로 연구자의 접근과 활용이 제한적이어서 공익적 연구는 부족했던 측면이 있었다"고 설명했다.
이어 "공단은 전 국민의 진료내역, 검진자료, 거주지 및 보험료 등 질적으로 우수한 자료를 보유하고 있다. 이는 국가정책 수립, 각종 학술연구 등에서 유용하게 사용될 수 있을 것"이라고 내다봤다.
건보공단은 앞으로 구축된 표본DB를 학회와의 협력, 심포지엄 등을 통해 검증을 거치고 학술연구에 활용할 수 있도록 공개할 계획이다.
구체적으로 표본코호트DB를 공익연구목적에 한해 심의, 제공될 예정이고 건강검진DB도 단계적으로 제공여부를 검토할 계획이다.
국민건강보험공단은 가입자의 진료내역, 검진결과, 요양기관정보 등을 바탕으로 층화계통추출방법을 통해 연구용 표본 데이터베이스(DB)를 구축했다고 22일 밝혔다.
층화계통추출은 조사할 집단을 동일한 몇 개의 층으로 나누고 층화된 집단에서 각각 일정 규모의 표본을 추출하는 방식이다. 예를들어 연령은 5세 단위로 구분해 각 집단에서의 표본을 추출한다는 것.
이번 DB는 지난해 7월부터 6개월간 고려대 의대 이준영 교수팀의 연구결과를 바탕으로 구축했다.
구축된 자료는 ▲성별, 연령별, 소득분위별 등으로 구분해 추출된 '표본코호트DB' ▲크론병 등 3개 희귀질환을 대상으로 하는 '희귀질병DB' ▲2001~2010년 5번의 건강검진을 모두 받은 수검자 240만명를 대상으로 하는 '건강검진DB' 등 총 3가지 종류다.
여기에는 2002~2010년 개인정보를 제외한 진료내역, 검진결과 등의 건강상태, 사망까지의 내용 등이 들어있다.
건보공단은 "지금까지 자료규모의 방대함과 개인정보보호 문제 등으로 연구자의 접근과 활용이 제한적이어서 공익적 연구는 부족했던 측면이 있었다"고 설명했다.
이어 "공단은 전 국민의 진료내역, 검진자료, 거주지 및 보험료 등 질적으로 우수한 자료를 보유하고 있다. 이는 국가정책 수립, 각종 학술연구 등에서 유용하게 사용될 수 있을 것"이라고 내다봤다.
건보공단은 앞으로 구축된 표본DB를 학회와의 협력, 심포지엄 등을 통해 검증을 거치고 학술연구에 활용할 수 있도록 공개할 계획이다.
구체적으로 표본코호트DB를 공익연구목적에 한해 심의, 제공될 예정이고 건강검진DB도 단계적으로 제공여부를 검토할 계획이다.