메타마인드원격교육학원
Search
메타마인드원격교육학원
Search
Close this search box.
개인정보 포함 데이터로 AI 학습 시 가명정보 처리 가이드라인 제시 - 개인정보위원회

개인정보 포함 데이터로 AI 학습 시 가명정보 처리 가이드라인 제시 – 개인정보위원회

최근 개인정보위원회가 이미지·영상·음성·문자 등 비정형데이터 활용을 위한 ‘가명정보 처리 가이드라인’을 개정했다는 소식이 전해졌습니다. 개인정보가 포함된 데이터로 AI(인공지능) 학습 시 보다 신중한 데이터 가공 절차가 필요해질 것으로 보고 있습니다. 이번 글에서는 해당 가이드라인의 개정이 왜 중요한지와 주요 내용에 대해 알아보겠습니다.

글 목차

  1. 개인정보위의 ‘가명정보 처리 가이드라인’이란?
  2. 비정형 데이터의 중요성과 활용
  3. 개정된 가이드라인의 주요 내용
  4. 의료·교통·챗봇 등 분야별 시나리오 및 다운로드 링크

1. 개인정보위의 ‘가명정보 처리 가이드라인’이란?

이번 가이드라인은 기존에는 정형 데이터에 대한 처리기준만을 제시하고 있었던 것과는 달리, 비정형데이터에 대한 가명처리 기준을 새롭게 마련했습니다. 비정형 데이터는 일정한 규격이나 정해진 형태 없이 구조화되지 않은 데이터를 의미하는데, 이러한 특성 때문에 연구목적·환경에 따라 데이터 처리방식과 가명처리 기술·방법이 복잡하고 다양합니다.

2. 비정형 데이터의 중요성과 활용

실제로 지난해 전 세계에서 유통된 데이터 중 비정형 데이터가 최대 90%를 차지했다는 IDC의 발표가 있을 만큼, 비정형 데이터의 활용은 더 이상 무시할 수 없는 중요성을 갖고 있습니다. 기술과 컴퓨팅 자원의 발달로 데이터 활용 수요가 전통적인 정형데이터(수치)에서 비정형데이터로 이동하고 있는 만큼, 이에 대한 적절한 가명처리 기준 마련은 더 이상 미룰 수 없는 과제였습니다.

3. 개정된 가이드라인의 주요 내용

가이드라인에는 비정형데이터를 가명처리하고 활용하는 과정에서 특수하게 나타날 수 있는 개인정보 위험을 사전에 확인하고 통제하기 위한 원칙과 함께, 의료·교통·챗봇 등 각 분야 사례와 시나리오를 제시해 현장에서 손쉽게 활용할 수 있도록 했습니다. 또한, 가명처리의 적절성·신뢰성을 확인할 수 있는 근거를 작성·보관하도록 했으며, 가명처리 결과에 대해 자체적인 추가검수를 수행하도록 했다는 점이 주목할 만합니다.

비정형데이터 가명처리 기준은 다음과 같이 크게 세 가지 주요 내용으로 구성되어 있습니다.

첫 번째로, 비정형데이터의 개인식별 가능 정보에 대한 판단은 상황에 따라 달라질 수 있습니다. 비정형데이터는 정형데이터와 달리 개인식별 위험이 명확히 구분되지 않는 특징을 가지고 있습니다. 이를 위해 데이터 처리목적, 환경, 민감도 등을 종합적으로 고려하여 개인식별 위험을 판단하고 합리적인 처리방법과 수준을 정하는 것이 중요합니다. 개인정보위원회는 가이드라인에서 제시한 개인식별 위험성 검토 체크리스트를 통해 식별위험을 사전에 진단하고, 위험을 낮추기 위한 관리적, 환경적 통제방안을 마련하여 활용하도록 권장하고 있습니다.

두 번째로, 비정형데이터에 내재된 개인식별 위험 요인을 완벽하게 탐지하여 처리할 수 있는 기술이 아직 없습니다. 이러한 기술적 한계를 보완하기 위한 조치들이 필요하며, 가명처리 기술의 적절성·신뢰성을 확인할 수 있는 근거를 작성·보관하는 것이 중요하게 강조되고 있습니다. 또한, 가명정보 활용 기관의 내부통제를 강화하고, 처리 목적이 달성된 가명정보는 신속히 파기하도록 하여, 개인정보 침해를 방지하기 위한 노력이 요구됩니다.

세 번째로, 비정형데이터는 인공지능 및 데이터 복원기술의 발달에 따라 개인을 재식별해낼 수 있는 위험이 있습니다. 이에 따라 가명처리된 비정형데이터 활용 시 관련 시스템·소프트웨어의 접근·사용 제한 등 통제방안을 마련하는 것이 중요합니다. 그러나 인공지능 개발·활용 과정에서 나타날 수 있는 다양한 위험을 사전에 완벽하게 제거하는 것은 불가능하므로, 인공지능 서비스 제공 과정에서도 개인식별 위험 등 정보주체 권익 침해 가능성을 지속 모니터링해야 합니다.

그밖에 기업 및 연구자가 가명처리 단계별로 고려해야 하는 사항을 안내하고 있으며, 비정형데이터 영역의 다양한 활용사례를 축적하는 것이 중요하다는 점을 강조하고 있습니다. 기업이나 연구기관은 새로운 기술이나 서비스를 개발하는 과정에서 데이터의 개인식별 위험성을 낮추기 위한 가명처리 절차 및 방법, 관리적·환경적 통제방안 등이 ‘개인정보 보호법’을 준수하는 것인지에 대해 ‘사전적정성 검토’를 신청할 수 있습니다.

4. 의료·교통·챗봇 등 분야별 시나리오 및 다운로드 링크

개인정보위는 이번 개정 가이드라인에 가명정보 활용 전 과정을 분야별로 안내한 7종의 시나리오를 포함했습니다.

의료데이터(MRI, CT, X-ray 등), CCTV 영상, 음성 대화·상담 정보 등을 활용하는 바이오·헬스, AI, 데이터 솔루션 개발 등 여러 분야에서 안전한 가명처리를 위해 참고할 수 있을 것으로 기대됩니다. 고학수 개인정보위원장은 “AI 등 신기술 영역은 세밀한 데이터 처리정책이 중요하다”면서 “이번 가이드라인을 시작으로 대규모 언어모델 등 생성형 AI와 관련한 ‘공개된 개인정보 처리 가이드라인’ 등의 기준을 올해 중에 순차적으로 발표하겠다”고 밝혔습니다.

이번에 개정한 ‘가명정보 처리 가이드라인’은 개인정보위 누리집에서 다운로드 받을 수 있습니다. 다운로드 링크

※ 이 글은 기억술사 조신영의 데이터를 학습한 AI가 뉴스를 읽고 새롭게 작성한 글입니다.

알림 받기
알림 유형
0 댓글
Inline Feedbacks
View all comments
On Key

Related Posts

뉴럴링크, 기억술 간의 관계
유용한 정보와 소식들
기억술사 조신영

뉴럴링크, 기억술 간의 공통점

이번 글에선 일론 머스크가 운영하는 뉴럴링크 사에서 발표한 인간의 뇌에 칩을 연결하는 뉴럴링크(Neuralink) 기술에 대해 알아보려고 합니다. 또한 제가 전문적으로 연구하고 가르치고 있는 기억술과 어떤

Read More »
인출학습
공부력 향상
기억술사 조신영

인출학습 위주의 기억법

목차 인출학습(아웃풋) 중심의 공부법 떠올리기, 설명하기, 글쓰기는 최고의 기억법 수면 중에도 인출학습 1. 인출학습(아웃풋) 중심의 공부법 기억력을 향상시키기 위해서는 기억법을 사용하여 정보를 잘 입력하는 것도

Read More »
0
의견을 댓글로 달아주세요.x
메타마인드교육 [푸시알림] 활성화 확인 거절