Cloudflare, Gen 13 서버 공개: 2배 향상된 성능과 효율성

by DD
2개월 전
조회수 22

Cloudflare는 Rust 기반의 FL2로의 전환에 맞춰 Gen 13 서버를 출시, 성능 및 효율성 향상을 도모함

Gen 13은 192-Core AMD EPYC™ Turin 9965 프로세서, DDR5-6400 메모리, PCIe 5.0 NVMe 스토리지, 100GbE 네트워크를 탑재하여 전반적인 성능 개선을 이룸

Gen 13은 Gen 12 대비 최대 2배의 처리량(Throughput), 50%의 전력 효율성 향상을 달성하여 데이터 센터 운영 비용 절감

L3 캐시(L3 Cache) 의존성을 줄이고 코어 수를 늘려 FL2 워크로드(Workload)에 최적화된 설계를 구현

향후 Cloudflare의 지속적인 성장을 지원하기 위해 확장성(Scalability) 및 운영 효율성(Operational Efficiency)을 고려한 설계를 적용

AMD EPYC™ 9965 프로세서 선택의 기술적 배경

Gen 13 서버는 AMD EPYC™ 9965 Turin 192-Core 프로세서를 탑재하여 Gen 12 대비 2배의 코어 수(Core Count)를 제공한다. 이는 FL2로의 전환과 함께 L3 캐시(L3 Cache) 의존성이 감소한 워크로드(Workload)에 최적화된 선택이다.

L3 캐시(L3 Cache) 축소: 코어당 L3 캐시(L3 Cache)는 Gen 12의 12MB에서 Gen 13의 2MB로 감소했지만, FL2의 워크로드 특성상 성능 저하 없음

TCO(Total Cost of Ownership) 최적화: 9965는 192개의 코어를 통해 최고의 초당 요청 수(Requests Per Second)를 달성하며, 전력 효율성(Power Efficiency) 또한 우수

운영 단순성(Operational Simplicity): 고밀도 서버(High-density Server)를 통해 운영 관리(Operational Management)의 효율성을 높이고, 전반적인 TCO를 절감

메모리 대역폭(Memory Bandwidth) 극대화 전략

Gen 13 서버는 768GB DDR5-6400 메모리를 탑재하고, 12개의 메모리 채널(Memory Channel)을 모두 활용하여 최대 614GB/s의 메모리 대역폭(Memory Bandwidth)을 제공한다.

1DPC(One DIMM Per Channel) 구성: 각 채널당 하나의 DIMM을 사용하여 메모리 대역폭(Memory Bandwidth)을 극대화하고, CPU의 데이터 처리 속도를 보장

4GB/Core 비율 유지: Gen 12와 동일하게 코어당 4GB의 메모리 용량을 유지하여 향후 워크로드 증가에 대비

듀얼 랭크(Dual Rank) DIMM: 듀얼 랭크(Dual Rank) DIMM을 통해 메모리 접근 지연 시간(Memory Latency)을 최소화하고, 최대 17.8%의 성능 향상 달성

PCIe 5.0 NVMe 스토리지(Storage) 도입의 의미

Gen 13 서버는 PCIe 5.0 NVMe 스토리지를 채택하여 향상된 스토리지 성능(Storage Performance)을 제공하며, 데이터 처리 속도를 높인다.

PCIe 5.0: Gen 4.0 대비 향상된 대역폭(Bandwidth)을 통해 스토리지 지연 시간(Storage Latency) 감소

스토리지 용량 확장: 24TB의 스토리지를 탑재하여 CDN 캐시(CDN Cache) 성능 향상 및 Durable Objects, Containers, Quicksilver 서비스 지원

U.2 드라이브 지원: 최대 10개의 U.2 PCIe Gen 5.0 NVMe 드라이브를 지원하는 전면 드라이브 베이(Front Drive Bay)를 통해 유연한 스토리지 구성(Storage Configuration) 가능

데이터 보호 강화: NVMe 2.0 및 OCP NVMe 2.0 규격 준수를 통해 데이터 보안(Data Security) 및 관리 효율성(Management Efficiency) 향상

100GbE 네트워크(Network) 도입과 성능 향상

Gen 13 서버는 100GbE 네트워크 인터페이스를 탑재하여 Gen 12 대비 4배 향상된 네트워크 대역폭(Network Bandwidth)을 제공한다.

병목 현상(Bottleneck) 해소: 192개의 코어를 지원하기 위해 25GbE에서 100GbE로 업그레이드하여 네트워크 병목 현상(Network Bottleneck)을 방지

공급망 안정성 확보: 듀얼 벤더(Dual Vendor) 전략을 통해 공급망 리스크(Supply Chain Risk)를 최소화하고, OCP 3.0 표준 준수

PCIe 4.0 x16 레인 할당: 듀얼 100GbE를 지원하기 위해 PCIe 4.0 x16 레인을 할당하여 충분한 대역폭(Bandwidth) 확보

관리 모듈 분리: DC-SCM 2.0을 통해 BIOS, BMC, HRoT 등 핵심 구성 요소의 보안(Security) 강화 및 관리 효율성(Management Efficiency) 증대

전력 공급 장치(Power Supply) 및 열 설계(Thermal Design) 최적화

Gen 13 서버는 1300W 80 PLUS Titanium CRPS를 사용하여 전력 효율성(Power Efficiency)을 극대화하고, EU Lot 9 규제를 준수한다.

전력 소비량 증가: 500W TDP CPU, 메모리 용량 증가, NVMe 드라이브 추가로 인해 전력 소비량(Power Consumption) 증가

1300W PSU 선택: 1000W PSU의 옵션 부족으로 인해 산업 표준(Industry Standard)에 따라 1300W PSU 채택

EU Lot 9 규제 준수: Titanium 등급 PSU를 사용하여 유럽 데이터 센터(European Data Center) 운영 규제 준수

2U 폼 팩터(Form Factor) 활용: 2U 폼 팩터와 5개의 팬을 통해 효율적인 냉각(Cooling) 시스템 구축

Inside Gen 13: how we built our most powerful server yet