파이(π)에 모든 파일을 저장하는 혁신적인 파일 시스템 등장!

파이(π)의 무한한 숫자열에 모든 파일을 저장하는 혁신적인 파일 시스템 πFS가 소개됨

100% 압축률을 주장하며 디스크 공간 낭비를 없애는 것을 목표로 함

실제로는 데이터 인덱스/길이 저장 공간이 데이터 자체만큼 필요하여 실질적 압축 효과는 미미하다는 지적이 다수임

π가 정규수(normal number)라는 이론적 가정에 기반하며, 이는 아직 증명되지 않은 상태임

π의 정규성(Normality) 가정과 실질적 압축 한계

커뮤니티에서는 π가 정규수(normal number)라는 이론적 가정에 기반한 πFS의 아이디어를 흥미롭게 보면서도, 실제로는 데이터의 주소(index)와 길이(length)를 저장하는 메타데이터가 원본 데이터만큼의 공간을 차지하거나 그 이상을 요구한다고 지적한다. 이는 정보 이론(Information Theory)의 기본 원리에 따라 데이터 자체를 표현하는 데 필요한 정보량과 동일하거나 더 많은 정보량이 필요하기 때문이며, 따라서 실질적인 데이터 압축(Data Compression) 효과는 없다는 결론이 지배적이다.

성능 병목: 바이트 단위 조회와 느린 속도

πFS의 초기 프로토타입은 바이트 단위로 π에서 데이터를 조회하는 방식으로 구현되어 극도로 느린 성능을 보인다. 한 사용자는 400줄 텍스트 파일을 저장하는 데 5분이 걸렸다고 보고했으며, 이는 Bailey–Borwein–Plouffe 공식을 이용한 조회 과정의 복잡성과 비효율성을 드러낸다. 향후 개선 방안으로 가변 길이 검색, 산술 코딩, 병렬 처리 등이 언급되었으나, 현재로서는 실용성(Practicality)이 매우 낮은 상태다.

메타데이터 중심 저장소의 역설

πFS는 데이터 자체를 저장하는 대신, π 내에서의 데이터 위치를 나타내는 메타데이터(Metadata)를 저장하는 데 집중한다. 이는 저장 공간을 절약한다는 아이디어에서 출발했지만, 결국 이 메타데이터를 관리하기 위한 별도의 저장 공간(Data Isolation Architecture)이 필요하다는 역설을 낳는다. 사용자들은 이 메타데이터를 종이에 적거나, 결국 다시 디스크에 저장해야 하는 상황을 지적하며 아이디어의 실현 가능성에 의문을 제기한다.

저작권 및 지식의 존재론적 함의

π의 무한한 숫자열에 모든 가능한 파일이 존재한다는 아이디어는 저작권 침해(Copyright Infringement)에 대한 흥미로운 질문을 던진다. 모든 데이터가 이미 π 안에 존재한다면, 이는 미래의 모든 지식(Future Knowledge)까지 포함하게 되며, 이는 존재론적이고 철학적인 논의로 이어진다. 일부 사용자는 이러한 관점이 '충격적'이라고 표현하며 아이디어의 독창성에 주목한다.

정보 이론 및 LLM과의 비교

이 프로젝트는 정보 이론의 관점에서 데이터 표현과 주소 지정의 관계를 탐구하게 한다. 과거에는 이러한 아이디어가 실용적인 압축 도구로 이어지지 못했지만, 최근 LLM(Large Language Models)이 손실 압축(Lossy Compression)의 형태로 방대한 정보를 효율적으로 표현하는 데 성공했다는 점에서 유사성을 찾을 수 있다. 다만 LLM은 막대한 컴퓨팅 자원을 필요로 한다는 점에서 πFS와는 다른 접근 방식을 취한다.