[헬스테크]
한국은 전 국민이 건강보험에 가입돼 주기적으로 건강검진을 받고 있다. 이렇게 수집한 양질의 의료 데이터는 의료 AI 발전의 자양분이 된다. AI 성능을 향상하려면 양질의 데이터를 이용한 학습이 필수기 때문이다. AI뿐 아니라 각종 의약품과 의료기기 개발에도 데이터는 반드시 필요하다. 개발하려는 제품의 시장성이 충분한지 파악하고, 임상적 활용 가능성을 가늠하는 데에 데이터가 근거를 제공한다. 보건의료데이터는 의료 AI 산업의 토대이자 기업의 의사 결정 근거이기 이전에 민감한 개인정보다. 최근 티빙 그리고 CU 택배 운영사 BGF네트웍스에서 개인정보 유출이 잇따르며 정보 보호에 관한 관심이 각별해졌다. 국민으로부터 수집된 의료 정보는 어떤 보호 아래 활용되고 있을까.
누적된 보건의료데이터를 관리·활용하고, 필요 시 기업들에 전달하는 기관 중 하나가 바로 건강보험심사평가원이다. 심평원은 2015년 ‘보건의료빅데이터개방시스템’을 구축해 데이터를 필요로 하는 사람이 자신의 수요에 맞게 보건의료빅테이터를 참고·활용할 수 있도록 했다. 2020년에는 보건의료분야 가명 정보 결합전문기관으로 선정됐다. 서로 다른 기관들이 보유하고 있는 가명 정보를 결합해 반출함으로써 보건의료 정책과 학술 연구를 지원하고 있다. ‘암 환자의 합병증과 만성질환 예측 연구’를 위해 ▲전국 암센터와 병원으로부터 수집한 암 치료 임상 정보 ▲건강보험공단에서 보유한 진료 정보 ▲통계청에서 보유한 사망 원인 정보 등을 결합해 연구 기관인 국립암센터로 전달한 것이 한 예다.
심평원은 진료비청구포털, e-평가자료 제출시스템, 보건의료자원 통합신고포털, 의약품안전사용(DUR), 영상자료제출시스템, 진료의뢰회송중계포털, 요양기관업무포털시스템, 보완자료제출시스템, 의약품안전관리종합정보센터 등의 창구를 통해 요양기관, 의약품 수입·제조업체, 정부·공공기관으로부터 보건의료데이터를 수집한다. 이로써 의료질평가정보, 의약품정보, 의료자원정보, 자동차보험정보, 치료재료정보, 진료행위정보, 비급여정보 등 7종의 정보를 보유하고 있다. 수집된 정보는 일차적으로는 요양급여와 건강보험 수가 심사 그리고 의료질 적정성 평가 등 내부 업무에 활용한다. 국민, 연구자, 산업계, 공공기관에 데이터를 개방할 시 보안을 위해 별도로 구축한 외부망을 통해 데이터를 제공하고 있다.
15일 열린 2026 경기도 의료협력포럼에서 심평원 이승범 팀장은 “수집한 데이터를 내부 업무에 활용할 때에도 환자 이름이 그대로 보존된 실명 정보는 활용하지 못한다”며 “모든 정보는 익명 정보나 가명 정보 형태로 내부에서 활용되거나 외부에 제공된다”고 했다. 익명 정보는 주어진 정보에 다른 정보를 추가해도 특정 개인을 식별할 수 없는 정보로, ‘2025년 1월에 서울에서 방광염으로 진료받은 환자에 대한 연령별 통계’ 따위가 이에 해당한다. 익명 정보는 개인정보 일부 혹은 전부를 삭제·대체한 것이라, 추가 정보가 있어야 특정 개인을 식별할 수 있는 정보를 말한다. 특정 개인에게 부여된 질병 코드, 연령, 처방받은 약 등에 관한 정보는 보존하되 개인의 이름을 A와 같은 식으로 가명 처리해 활용하는 것이 한 예다. 현재 심평원은 환자 성별, 주 상병 코드, 입내원일수 원외처방일수, 1회 투약량 등 등 급여 비용 청구 명세서에 나오는 데이터를 가명 처리해 제공하고 있다.정부는 보건의료빅테이터 AI를 활용한 창업경진대회를 여는 등 보건의료데이터의 적극 사용을 장려하고 있다. 심평원 보건의료빅데이터개방시스템에 접속하면 크게 ‘보건의료빅데이터’ ‘의료통계정보’ ‘공공데이터’ ‘데이터결합’ 등의 메뉴를 확인할 수 있다. 이중 ‘의료통계정보’는 의약품, 의료자원, 질병 현황 등의 변화 추이를 확인할 수 있는 그래프와 도표 등을 제공한다. ‘공공데이터’는 심평원이 진료정보, 의약품, 치료재료, 의료자원, 병원평가, 의료영상판독 등에 관련해 구축한 데이터를 엑셀 파일이나 오픈 API(소프트웨어 개발에 곧바로 활용할 수 있도록 데이터를 표준화한 것)형태로 제공한다. ‘보건의료빅데이터’는 심평원 소유 정보를 사용자가 사용 목적에 따라 직접 청구할 수 있도록 한다. 필요로 하는 정부가 여러 기관에 흩어져 있는 경우 ‘데이터 결합’ 메뉴에서 결합을 신청할 수 있다. 정보는 보안을 위해 외부 폐쇄 분석망을 통해 제공되므로 신청자도 이 망 내에서 데이터를 분석한 다음 자신의 결과물을 외부로 반출할 수 있다. 심평원에서 제공한 원자료는 외부로 반출이 불가능하다.
이승범 팀장은 “대한민국 주민등록 인구 수 만큼인 5100만여 명 규모의 보건의료 빅데이터를 수집한 국가는 전 세계적으로 흔치 않다”며 “심평원 데이터는 실제 의료 환경과 제도를 반영하고 있는 동시에 의료 행위에 대한 전반적 데이터를 포괄하고 있으니 적극 활용을 바란다”고 했다.
누적된 보건의료데이터를 관리·활용하고, 필요 시 기업들에 전달하는 기관 중 하나가 바로 건강보험심사평가원이다. 심평원은 2015년 ‘보건의료빅데이터개방시스템’을 구축해 데이터를 필요로 하는 사람이 자신의 수요에 맞게 보건의료빅테이터를 참고·활용할 수 있도록 했다. 2020년에는 보건의료분야 가명 정보 결합전문기관으로 선정됐다. 서로 다른 기관들이 보유하고 있는 가명 정보를 결합해 반출함으로써 보건의료 정책과 학술 연구를 지원하고 있다. ‘암 환자의 합병증과 만성질환 예측 연구’를 위해 ▲전국 암센터와 병원으로부터 수집한 암 치료 임상 정보 ▲건강보험공단에서 보유한 진료 정보 ▲통계청에서 보유한 사망 원인 정보 등을 결합해 연구 기관인 국립암센터로 전달한 것이 한 예다.
심평원은 진료비청구포털, e-평가자료 제출시스템, 보건의료자원 통합신고포털, 의약품안전사용(DUR), 영상자료제출시스템, 진료의뢰회송중계포털, 요양기관업무포털시스템, 보완자료제출시스템, 의약품안전관리종합정보센터 등의 창구를 통해 요양기관, 의약품 수입·제조업체, 정부·공공기관으로부터 보건의료데이터를 수집한다. 이로써 의료질평가정보, 의약품정보, 의료자원정보, 자동차보험정보, 치료재료정보, 진료행위정보, 비급여정보 등 7종의 정보를 보유하고 있다. 수집된 정보는 일차적으로는 요양급여와 건강보험 수가 심사 그리고 의료질 적정성 평가 등 내부 업무에 활용한다. 국민, 연구자, 산업계, 공공기관에 데이터를 개방할 시 보안을 위해 별도로 구축한 외부망을 통해 데이터를 제공하고 있다.
15일 열린 2026 경기도 의료협력포럼에서 심평원 이승범 팀장은 “수집한 데이터를 내부 업무에 활용할 때에도 환자 이름이 그대로 보존된 실명 정보는 활용하지 못한다”며 “모든 정보는 익명 정보나 가명 정보 형태로 내부에서 활용되거나 외부에 제공된다”고 했다. 익명 정보는 주어진 정보에 다른 정보를 추가해도 특정 개인을 식별할 수 없는 정보로, ‘2025년 1월에 서울에서 방광염으로 진료받은 환자에 대한 연령별 통계’ 따위가 이에 해당한다. 익명 정보는 개인정보 일부 혹은 전부를 삭제·대체한 것이라, 추가 정보가 있어야 특정 개인을 식별할 수 있는 정보를 말한다. 특정 개인에게 부여된 질병 코드, 연령, 처방받은 약 등에 관한 정보는 보존하되 개인의 이름을 A와 같은 식으로 가명 처리해 활용하는 것이 한 예다. 현재 심평원은 환자 성별, 주 상병 코드, 입내원일수 원외처방일수, 1회 투약량 등 등 급여 비용 청구 명세서에 나오는 데이터를 가명 처리해 제공하고 있다.정부는 보건의료빅테이터 AI를 활용한 창업경진대회를 여는 등 보건의료데이터의 적극 사용을 장려하고 있다. 심평원 보건의료빅데이터개방시스템에 접속하면 크게 ‘보건의료빅데이터’ ‘의료통계정보’ ‘공공데이터’ ‘데이터결합’ 등의 메뉴를 확인할 수 있다. 이중 ‘의료통계정보’는 의약품, 의료자원, 질병 현황 등의 변화 추이를 확인할 수 있는 그래프와 도표 등을 제공한다. ‘공공데이터’는 심평원이 진료정보, 의약품, 치료재료, 의료자원, 병원평가, 의료영상판독 등에 관련해 구축한 데이터를 엑셀 파일이나 오픈 API(소프트웨어 개발에 곧바로 활용할 수 있도록 데이터를 표준화한 것)형태로 제공한다. ‘보건의료빅데이터’는 심평원 소유 정보를 사용자가 사용 목적에 따라 직접 청구할 수 있도록 한다. 필요로 하는 정부가 여러 기관에 흩어져 있는 경우 ‘데이터 결합’ 메뉴에서 결합을 신청할 수 있다. 정보는 보안을 위해 외부 폐쇄 분석망을 통해 제공되므로 신청자도 이 망 내에서 데이터를 분석한 다음 자신의 결과물을 외부로 반출할 수 있다. 심평원에서 제공한 원자료는 외부로 반출이 불가능하다.
이승범 팀장은 “대한민국 주민등록 인구 수 만큼인 5100만여 명 규모의 보건의료 빅데이터를 수집한 국가는 전 세계적으로 흔치 않다”며 “심평원 데이터는 실제 의료 환경과 제도를 반영하고 있는 동시에 의료 행위에 대한 전반적 데이터를 포괄하고 있으니 적극 활용을 바란다”고 했다.