개인정보보호법 등 '데이터 3법' 국회 통과를 계기로 정부·공공기관들이 내부 데이터를 개방·공유하기 위해 관련 플랫폼 투자에 본격적으로 나선다. 의료·금융 등 중요 공공데이터를 개방해 국내 기업들에 사업 기회를 제공하기 위해서다.
10일 업계에 따르면 서울시, 건강보험심사평가원, 금융결제원 등은 내부 데이터 분석·공유체계를 업그레이드하기 위한 마스터플랜과 시스템 구축을 잇따라 추진한다.
서울시는 시 내부와 공공기관, 민간간에 데이터 공유체계를 구축해 관련 산업을 키우기 위해 107억원 규모의 빅데이터 통합저장소(데이터레이크) 프로젝트를 추진한다. 내·외부 데이터 수집·저장·활용을 위한 일원화된 관리체계를 구축하고, 막대한 양의 원시 데이터를 원래 형태 그대로 보관하는 물리적 공간을 확보한다는 계획이다.
이를 통해, 교통·소방·환경 등 시가 보유한 모든 데이터를 통합 저장·관리하고, 선택적 데이터 개방에서 전면 개방으로 체계를 전환한다는 전략이다. 이 과정에서 개인정보 비식별화, 유효 데이터 수집·연계·관리 등을 자동화하고, 외부에서 필요로 하는 데이터를 제공하기 전 개인정보를 찾아내 비식별화하는 안전지대(샌드박스)를 운영할 예정이다.
시는 교통·안전·시설 관련 데이터 서비스를 시범적으로 시작한 후 내부 공공행정 데이터, 비정형 데이터 등으로 범위를 확대할 계획이다. 빅데이터 통합저장소에 저장하는 데이터 종류도 교통·환경·경제·문화 등 정형 데이터에 이어 내년까지 비정형 데이터까지 늘릴 예정이다. 제공하는 데이터의 품질을 높이기 위해 데이터 품질관리시스템과 메타데이터 관리시스템을 도입하고, 내부 데이터 서비스는 프라이빗 클라우드, 시민용 서비스는 자체 시스템(온프레미스)과 퍼블릭 클라우드를 혼용할 계획이다.
서울시 관계자는 "기존 데이터 서비스와 활용 방식으로는 급변하는 기술변화 속에 가치 창출에 한계가 있다"면서 "적기에 데이터를 수집하고 제공하는 조직과 시스템, 제도를 통해 빅데이터 기반 도시문제 해결과 산업 육성에 나설 것"이라고 밝혔다.
심평원은 내·외부의 데이터 활용과 융·복합 수요에 대응해 차세대 보건의료 빅데이터 개방시스템을 구축키로 하고 상반기 중 로드맵을 수립한다. 데이터 3법 개정에 대응해 가명정보 관리, 개인정보 비식별 조치, 데이터 연계·활용을 위한 구체적인 방안과 조직체계도 마련한다.
심평원은 병원, 제약사, 식약처 등에서 실시간 수집·정제한 범국가 보건의료 빅데이터를 보유하고 있다. 연 14억건에 달하는 전 국민 진료정보와 국내에서 생산·유통되는 의약품 정보, 의료 인력·시설 정보, 의료장비 정보 등이다.
그동안 오픈 API(애플리케이션 인터페이스)나 공공 데이터셋 형태로 데이터를 개방했지만 산업계가 보다 상세한 정보를 요구함에 따라 세부 데이터 공유체계를 갖추고 데이터 품질수준도 높인다는 계획이다. 보다 유연한 서비스가 이뤄질 수 있도록 클라우드 플랫폼 도입도 추진한다.
심평원 관계자는 "대내·외 데이터 연계와 융합을 통해 빅데이터 활용가치를 높이고, 다양한 분야에 활용 가능한 사용자 맞춤형 데이터를 제공하는 기반을 갖출 것"이라고 말했다.
5대 국가 기간전산망 중 하나인 금융공동망 구축·운영기관인 금융결제원은 금융데이터 분석·공유체계를 업그레이드하기 위해 전략수립에 나선다. 금결원은 CD(현금자동인출기) 공동망, 타행환공동망, 전자금융 공동망, 어음교환, 지로 지급결제시스템 등 금융분야 핵심 인프라를 운영하고 있다. 금결원은 기관 전체 업무와 관련된 데이터 현황을 진단하고, 데이터 활용목적과 연계성을 고려해 데이터를 분류하는 한편 분석·개방·통계작성 등 데이터 활용목적에 따라 데이터마트 모델을 마련할 예정이다. 또 전체 데이터를 수집·저장·활용하기 위한 통합 데이터저장소도 설계한다. 금결원은 상반기 중 외부 컨설팅과 자체 작업을 거쳐 추진 로드맵을 마련한 후 본격적인 시스템 구축을 추진할 계획이다.
|