PhotoDNA 해시, 이미지 복원 가능성 입증: 개인 정보 보호에 경고등 켜지다!

마이크로소프트(Microsoft)의 PhotoDNA 해시가 머신러닝(Machine Learning)을 통해 이미지 재구성(Image Reconstruction)이 가능하다는 연구 결과 발표

Ribosome이라는 기술을 사용하여 PhotoDNA 해시로부터 썸네일 품질(Thumbnail Quality)의 이미지를 복원하는 데 성공

PhotoDNA의 폐쇄적인 특성(Closed-Source Nature)으로 인해 해시 알고리즘 연구가 부족했으나, 이번 연구를 통해 취약점(Vulnerability)이 드러남

다양한 데이터셋(CelebA, COCO 등)을 활용하여 모델을 훈련, 데이터셋의 특성(Dataset Characteristics)이 복원 결과에 영향

PhotoDNA 해시의 역설계 및 이미지 복원

본 연구는 PhotoDNA 해시(Hash)를 머신러닝 모델로 처리하여 원본 이미지의 썸네일(Thumbnail)을 복원하는 방법을 제시한다. 특히, DCGAN(Deep Convolutional Generative Adversarial Network)과 유사한 구조의 신경망을 활용하여 144바이트의 PhotoDNA 해시를 100x100 픽셀 이미지로 변환한다. 이는 PhotoDNA가 이미지의 대략적인 구조(General Structure)를 인코딩한다는 점을 시사하며, 해시 함수가 완벽하게 정보를 숨기지 못함을 보여준다. GitHub에서 코드와 사전 훈련된 모델을 제공한다.