'이루다 AI'가 일깨운 개인정보 교훈…개인정보위, 올해 R&D 추진


정보주체 권리, 개인정보 유·노출 방지, 안전한 활용 등 3대 분야 선정

[아이뉴스24 박진영 기자] 개인정보보호위원회가 올해부터 개인정보 보호 강화 기술 개발에 나선다. 올해부터 오는 2026년까지 3대 분야에서 11대 핵심기술을 개발할 예정이다.

심성재 개인정보위 서기관이 '개인정보 보호·활용 기술 R&D 로드맵 및 2022년 R&D 중점 추진방향'에 대해 발표하고 있다. [사진=온라인 영상 캡처]

개인정보보호위원회(위원장 윤종인, 이하 개인정보위)는 한국인터넷진흥원(원장 이원태, 이하 KISA)과 함께 24일 오후 '2022년도 개인정보 보호 강화기술 연구개발(R&D)' 사업설명회를 개최했다.

현재 개인정보 기술은 정보보안 기술 중심으로 논의되고 있는 상황. 이는 데이터 시대에 정보주체의 권리보장과 안전한 활용 지원에는 한계가 있다. 이에 개인정보위는 정보보안 기술을 기반으로 개인정보 보호·활용에 특화된 기술 개발을 추진한다.

개인정보위의 개인정보 보호 혁실기술 개발은 크게 ▲정보주체의 권리보장 강화 ▲개인정보의 유·노출 위험 최소화 ▲개인정보의 안전한 활용 지원 등을 중심으로 기술 개발에 나선다.

올해에는 주요 분야별 대표 핵심기술 4개를 우선적으로 개발하고, 총 28억 8천만원이 투입될 예정이다.

우선 정보주체 권리보장 강화를 위해 온라인 상 수집되는 정보주체의 행태정보 탐지 및 자기 통제기술을 개발한다. 이는 사용자 온라인 활동기록을 사용자 동의없이 추적 또는 행태 정보로 수집하는 행위를 탐지·통제할 수 있도록 지원한다. 이 사업은 4년간 진행되며, 올해 6억원의 예산이 투입될 예정이다.

아울러 개인정보 유·노출 위험 최소화를 위해 올해에는 2개 핵심 기술 개발이 추진된다.

우선, 대화형 텍스트에서 개인정보를 탐지·비식별화 하는 기술이다. 최근 챗봇 이루다 등 편향성 문제는 물론, 인공지능(AI) 기술개발을 위한 학습용 데이터 처리에 있어서 프라이버시 이슈가 지속적으로 제기되고 있는 상황. 기술 필요의 시급성으로 인해 올해에만 11억 정도의 예산이 투입된다.

이 기술은 텍스트 기반 비정형 데이터 내 포함된 개인 식별 요소를 AI기반으로 자동 탐지해 비식별화한다. 대화나 문장의 목적과 주제에 따라 AI기술을 활용한 개체명 인식을 통해 개인정보를 상황에 맞게 검출·탐지하고, 개인정보를 비식별 처리하거나 대화내 데이터 결합 시 개인정보 재식별 위험까지 탐지할 수 있는 기술이다.

또 온라인서비스제공자(OSP) 대상 영상 콘텐츠에서 개인정보를 탐지하는 기술도 개발한다. 인터넷 상 다양한 OSP를 대상으로 영상 콘텐츠 내 개인정보를 검색하고, 자신의 정보가 남용되는지 등의 현황을 개인이 주체적으로 확인할 수 있을 것으로 기대된다.

아울러 개인정보의 안전한 활용 지원을 위해 가명·익명처리 기술도 개발한다.

특히, 의료·유통 등에서 활용되는 반정형 트랜잭션이나 실시간 수집 데이터에서의 개인정보 가명·익명처리 기술을 개발한다. 트랜잭션 데이터는 하나의 데이터 셀 내에 여러 항목이 집합으로 구성된 데이터를 뜻하며, 한 명의 환자에 대한 질병코드, 한 명의 고객이 구매한 상품코드 등이 해당된다.

심동욱 KISA 데이터안전활용단장은 "올해 추진하는 4개 과제 중 자기통제기술 개발을 제외한 3개의 과제는 산업체 참여가 필수인 과제들"이라면서, "특히, 업계의 의견을 바탕으로 실증에 대한 부분을 강화했다"고 밝혔다.

/박진영 기자(sunlight@inews24.com)







포토뉴스