PDF·이미지 개인정보 가리기 — 100% 안전하게 문서 마스킹(Redaction)하는 법
이력서의 주민등록번호 뒷자리, 부동산 계약서의 상세 주소, 거래 명세서의 은행 계좌번호... 문서를 외부에 제출하기 전 중요 정보를 검은 박스로 가리고 계시나요? 그렇다면 당신의 개인정보는 심각한 위험에 노출되어 있을 수 있습니다.
검은 상자 아래에 숨겨진 진실: 왜 덮어쓰기는 안전하지 않을까?
가장 널리 쓰이는 문서 가리기 방식은 Acrobat Reader, 한글(HWP), MS Word, 혹은 macOS의 '미리보기' 앱을 사용해 민감한 텍스트 위에 검은색 사각형 도형을 그려 넣는 것입니다. 화면으로 볼 때는 검은 상자가 글자를 확실히 가리고 있으므로 누구나 완벽히 가려졌다고 믿게 됩니다.
하지만 이는 시각적인 착시에 불과합니다. 많은 문서 편집기에서 추가한 도형은 텍스트의 레이어 위에 단순히 얹어지는 개별 레이어로 저장됩니다. 파일 내부에 기록된 원본 텍스트 데이터는 바이트 단위로 고스란히 보존되어 있습니다.
수신자(혹은 악의적인 유포자)가 해당 PDF 파일을 열고 가려진 영역을 마우스로 드래그하여 복사(Ctrl+C)한 뒤 메모장에 붙여넣기(Ctrl+V)하면, 검은 박스 뒤에 숨겨져 있던 텍스트가 아무 제약 없이 튀어 나옵니다. 또한 전문 PDF 편집기를 사용하여 '도형 레이어 삭제' 버튼을 클릭하면 검은 상자가 걷히고 원본 문서가 선명하게 드러나게 됩니다.
실제로 일어났던 마스킹 실패 유출 사고
도형 덮어쓰기 방식으로 인한 기밀 정보 유출은 전 세계적인 보안 사고의 주범입니다.
- 정부 기밀 유출 사고: 2011년 미국 국방부는 아프가니스탄 전쟁 관련 기밀 보고서를 인터넷에 배포하면서 민감한 작전명과 인명을 검은색 사각형으로 가렸습니다. 하지만 네티즌들이 해당 PDF의 텍스트를 마우스로 긁어 복사하면서 모든 기밀 정보가 그대로 드러났고, 이는 역사적인 군사 기밀 노출 사건으로 이어졌습니다.
- 판결문 유출 사고: 법원이나 수사기관에서 피의자 및 피해자 정보를 보호하기 위해 주민등록번호 등을 검은 상자로 가린 판결문 PDF를 언론사 등에 제공했다가, 텍스트 드래그 및 레이어 분리로 인해 개인 인적사항이 대규모로 복원되는 사고가 수차례 발생하여 법원의 보완 지침이 개정되기도 했습니다.
물리적인 '데이터 파괴'가 필요한 이유 (리댁션의 원리)
보안 및 법률 업계에서는 문서를 온전하게 비식별화하는 이 과정을 '리댁션(Redaction)'이라고 부릅니다. 리댁션은 화면에서 정보의 시각적 형태만 가리는 것을 넘어, 파일 구조 자체에서 해당 바이트를 삭제하거나 영구 교체하는 행위를 지칭합니다.
안전한 리댁션을 구현하려면 다음 두 가지 기술 조건 중 하나를 만족해야 합니다.
| 방식 | 처리 메커니즘 | 보안 강도 |
|---|---|---|
| 📝 텍스트 영구 파괴 (Text Stripping) | 지정된 영역의 좌표에 존재하는 모든 텍스트 객체와 서체 정보를 바이너리 파일 내부에서 물리적으로 완전히 삭제합니다. | 매우 높음 |
| 🖼️ 픽셀 재구성 및 래스터화 (Rasterization) | 문서 전체를 고해상도 이미지로 변환한 뒤 마스킹 영역의 픽셀 데이터를 검은색 단색 픽셀로 덮어쓰고(Flattening), 새로운 파일로 내보냅니다. 기존 텍스트 레이어가 사라져 드래그할 수 없습니다. | 매우 높음 (추천) |
| ⬛ 단순 도형 오버레이 (Overlay) | 텍스트가 존재하는 메인 레이어 상단에 검은색 드로잉 벡터 객체만 추가합니다. | 위험 (사용 불가) |
100% 안전하게 문서 개인정보를 가리는 실전 가이드
그렇다면 우리는 어떻게 안전하게 문서를 마스킹하여 공유할 수 있을까요?
1. 100% 로컬에서 동작하는 전용 리댁션 도구 사용 (강력 추천)
가장 안전하고 효율적인 방법은 문서를 서버로 업로드하지 않고 사용자 기기 브라우저에서 100% 로컬 이미지 래스터화 방식으로 가림 처리를 수행하는 도구를 사용하는 것입니다.
Onew Apps에서 제공하는 DocSanitizer를 사용하면 다음과 같은 장점이 있습니다.
- 서버 업로드 없음: 중요한 문서를 외부 웹 서버에 올리지 않으므로, 처리 도중 생길 수 있는 클라우드상의 유출 위험을 100% 차단합니다. 모든 동작이 기기 내부(웹 어셈블리 및 Canvas API 활용)에서 완료됩니다.
- 이미지 래스터화 적용: 가려진 영역의 원본 픽셀 데이터를 물리적으로 교체한 후, 텍스트 벡터 레이어를 이미지 레이어로 강제 병합(래스터화)하여 출력하므로 텍스트 드래그 및 복구가 불가능합니다.
- 유료 편집기 불필요: 비싼 어도비 아크로뱃 프로(Adobe Acrobat Pro) 라이선스 없이도 누구나 웹 브라우저에서 무상으로 이용 가능합니다.
2. 종이 인쇄 후 물리적 마스킹 및 스캔
만약 소프트웨어를 전혀 신뢰할 수 없는 환경이라면 아날로그 방식을 사용해야 합니다.
- 문서를 종이로 직접 출력합니다.
- 가릴 부분을 검은색 컴퓨터용 사인펜이나 네임펜으로 빈틈없이 칠합니다. (주의: 일반 유성펜은 빛을 비추면 뒤의 글씨가 비쳐 보일 수 있으므로 불투명한 암전 테이프나 진한 네임펜을 사용해야 합니다.)
- 가려진 종이 문서를 다시 스캐너나 모바일 스캔 앱을 이용해 PDF/이미지 파일로 변환합니다.
이 방법은 물리적으로 픽셀 데이터를 평면화(Flattening)하기 때문에 완전히 안전하지만, 종이 낭비와 화질 저하가 발생하며 대량의 문서를 처리하기에는 생산성이 극히 떨어지는 한계가 있습니다.
3. 어도비 아크로뱃 프로의 교정(Redact) 기능 활용
Adobe Acrobat Pro의 정식 유료 버전을 구독 중이라면, 상단 메뉴의 도구 -> 교정(Redact) 기능을 이용할 수 있습니다. 텍스트를 마우스로 긁어 선택한 뒤 '적용'을 누르면 파일 바이너리 구조에서 해당 문자열이 완전히 소거됩니다. 단, 교정 적용 전의 임시 미리보기 상태에서 파일을 저장하면 데이터가 남아 있으므로 반드시 '교정 적용(Apply)' 단계를 거쳐 최종 저장해야 합니다.
문서 내보내기 전 자가진단 체크리스트
작업을 마친 문서를 발송하기 전에 아래 3가지 항목을 반드시 체크해보세요.
- ✅ 드래그 확인: 가려진 영역 위로 마우스를 올려 드래그가 되는지, 혹은 전체 선택(Ctrl+A)을 한 뒤 메모장에 붙여넣었을 때 가려진 글자가 복사되는지 확인하세요.
- ✅ 파일 용량 대조: 텍스트 및 레이어가 제대로 병합 및 파괴되었다면, 다수의 정보가 픽셀화되어 원본보다 파일 형태가 최적화되거나 단순화됩니다.
- ✅ 서버 전송 여부 확인: 문서를 가리기 위해 인터넷에 있는 이름 모를 사이트에 PDF를 통째로 업로드하지 마세요. 해당 사이트의 서버 로그에 주민등록증이나 계약서 원본이 영구히 저장될 위험이 있습니다.