티스토리 뷰

개인정보 처리 방식 4가지

핵심 개념

개인정보를 다룰 때 "얼마나 식별 가능성을 제거하느냐" 에 따라 나뉨.

1. 식별화 (Identification)

개인을 특정할 수 있는 상태 그대로 두는 것

처리 없이 원본 데이터를 그대로 사용하는 상태(처리 전 기준점)

이름: 홍길동
생년월일: 1990-03-15
주소: 서울시 강남구 XX동
전화번호: 010-1234-5678

→ 누군지 바로 알 수 있음


2. 가명화 (Pseudonymization) ⭐️

식별 정보를 다른 값으로 대체하되, 추가 정보가 있으면 복원 가능

핵심은 "키(key)를 따로 보관하면 되돌릴 수 있다"

이름: 홍길동 → A001 (매핑 테이블 별도 보관)
생년월일: 1990-03-15 → 1990년대생
주소: 서울시 강남구 XX동 → 서울시 강남구
전화번호: 010-1234-5678 → 삭제 또는 암호화

법적 위치:

  • 개인정보 보호법상 여전히 개인정보로 분류
  • 단, 가명처리 후 통계·연구·공익 목적으로 동의 없이 활용 가능
  • 재식별 시도는 법적으로 금지

실제 활용 예:

  • 병원 의료 데이터 연구
  • 금융 빅데이터 분석
  • 신약 개발 임상 연구

3. 익명화 (Anonymization)

식별 정보를 완전히 제거하여 복원 자체가 불가능한 상태

어떤 추가 정보를 갖다 붙여도 원래 누구인지 알 수 없어야 함(가명화와의 결정적 차이)

이름: 홍길동 → 완전 삭제
생년월일: 1990-03-15 → 30대
주소: 서울시 강남구 XX동 → 수도권 거주자
전화번호: → 완전 삭제

법적 위치:

  • 익명 처리된 데이터는 개인정보가 아님
  • 개인정보 보호법 적용 제외
  • 동의 없이 자유롭게 활용 가능

익명화 기법들:

<예시>

일반화 구체적 값을 범주로 변환 25세 → 20대
억제 특정 값 자체를 삭제 희귀 직업 → 삭제
잡음 추가 랜덤 오차를 더함 키 175cm → 173~177cm
데이터 스와핑 레코드 간 값을 교환 A의 소득 ↔ B의 소득
집계 개인 단위 → 집단 통계 개인 소득 → 평균 소득

4. 삭제화 (Deletion / Erasure)

개인정보 자체를 완전히 지워버리는 것

익명화가 "알아볼 수 없게 바꾸는 것"이라면, 삭제화는 "아예 없애버리는 것"

이름: 홍길동 → [레코드 자체 삭제]
생년월일: 1990-03-15 → [삭제]
주소: → [삭제]
전화번호: → [삭제]

법적 맥락:

  • GDPR의 "잊혀질 권리(Right to be Forgotten)" 가 대표 사례
  • 개인이 자신의 데이터 삭제를 요청할 수 있는 권리
  • 보유 기간 초과 시 의무적으로 파기

한눈에 비교

구분 구분복원 가능? 개인정보 해당? 활용 자유도
식별화 ✅ 원본 그대로 ✅ 해당 ❌ 동의 필요
가명화 ✅ 키 있으면 가능 ✅ 해당 🔶 조건부 허용
익명화 ❌ 불가능 ❌ 비해당 ✅ 자유 활용
삭제화 ❌ 불가능 ❌ (없음) - (데이터 없음)

 


⭐️ 시험 핵심 포인트

가명화 vs 익명화 가 가장 많이 헷갈리는 부분.
- 가명화 = 바꿨지만 키만 있으면 되돌릴 수 있음 → 여전히 개인정보
- 익명화 = 어떻게 해도 누군지 모름 → 개인정보 아님