S3 위에 구축된 새로운 파일 시스템 ZeroFS
S3 객체 스토리지 위에 파일 시스템 인터페이스를 제공하는 ZeroFS가 공개됨
로그 구조(Log-structured) 접근 방식으로 S3의 쓰기 성능(Write Performance) 향상을 목표로 함
커뮤니티에서는 서브 밀리초 쓰기 성능 주장에 대한 기술적 의문이 제기됨
내구성(Durability) 및 장애 모드(Failure Modes)에 대한 명확한 설명이 필요하다는 의견이 있음
S3 기반 파일 시스템의 성능 주장 검증
댓글에서는 ZeroFS의 서브 밀리초 쓰기 성능(Sub-millisecond Write Performance) 주장에 대해 회의적인 시각이 지배적입니다. 특히, 벤치마크에서 `fsync` 시간이 측정되지 않아 실제 S3에서의 데이터 내구성(Data Durability)을 보장하는 쓰기 지연 시간(Write Latency)이 아닌, 네트워크 또는 커널 수준의 작업 시간일 가능성이 높다고 지적합니다. 이는 객체 스토리지의 근본적인 지연 시간(Inherent Latency)을 간과한 주장일 수 있습니다.
유사 아키텍처 및 경쟁 기술 비교
커뮤니티에서는 ZeroFS와 유사한 접근 방식을 취하는 FiberFS가 언급되었습니다. 또한, 과거에 Ceph나 Lustre와 같은 분산 파일 시스템이 S3와 유사하게 블록을 다루지만, 별도의 메타데이터 서버를 통해 핫 콘텐츠(Hot Content)를 효율적으로 관리하는 방식을 사용했다는 점이 지적됩니다. ZeroFS가 이러한 기존 솔루션과 차별화되는 지점, 특히 메타데이터 관리 전략(Metadata Management Strategy)에 대한 설명이 필요합니다.
내구성 및 장애 모드에 대한 우려
사용자들은 ZeroFS가 S3 위에 구축될 때 데이터 내구성(Data Durability)과 손실 창(Loss Window)에 대한 명확한 보증이 부족하다고 우려합니다. 특히 장애 모드(Failure Modes)에 대한 철저한 분석과 테스트 결과 제시가 신뢰 확보에 중요하다고 강조합니다. AI를 활용한 포괄적인 테스트(Exhaustive Testing), 예를 들어 전력 손실, 서버 손실 시나리오 등에 대한 검증이 필요하다는 의견이 제시되었습니다.
객체 스토리지 접근 비용의 함정
S3나 GCS와 같은 객체 스토리지에 대한 읽기/쓰기 작업(Read/Write Operations)은 단순 저장된 바이트 수보다 훨씬 비싸다는 점이 지적됩니다. ZeroFS가 S3 접근을 추상화하는 방식은 이러한 비용 문제(Cost Implications)를 간과할 수 있다는 우려를 낳습니다. 특히 128KiB 단위로 데이터를 가져오는 방식은 작은 파일(Small Files)이나 빈번한 쓰기 작업(Frequent Writes) 시 예상치 못한 비용 증가를 초래할 수 있습니다.