OpenJDK, 40줄 수정으로 400배 성능 향상!

OpenJDK 커밋 로그 분석을 통해 40줄의 코드 삭제로 400배의 성능 향상을 이룬 사례를 발견함

기존의 /proc 기반 CPU 시간 측정 방식 대신 clock_gettime() 함수를 사용하여 성능 병목을 해결함

clock_gettime() 사용으로 시스템 콜(System Call) 횟수 감소 및 커널 락(Kernel Lock) 경쟁 문제를 해결함

추가적으로, clockid를 직접 구성하여 커널의 빠른 경로(Fast Path)를 활용하는 최적화 기법을 제시함

/proc 기반 CPU 시간 측정 방식의 문제점

기존 OpenJDK는 스레드(Thread)의 CPU 사용 시간을 측정하기 위해 `/proc` 파일 시스템을 사용했다. 이 방식은 파일 I/O(File I/O), 문자열 파싱(String Parsing), 그리고 여러 번의 시스템 콜(System Call)을 필요로 하여 성능 저하의 원인이 되었다. 특히, 경쟁 조건(Race Condition) 하에서는 커널 자원(Kernel Resource)에 대한 경합으로 인해 성능 저하가 더욱 심화되었다.

clock_gettime()을 활용한 성능 개선

새로운 구현은 `clock_gettime()` 함수를 사용하여 CPU 시간을 측정한다. 이 방식은 단일 시스템 콜만 호출하며, 복잡한 파싱 과정이 필요 없다. POSIX 표준(POSIX Standard)을 준수하면서도, Linux 커널의 특정 기능을 활용하여 사용자 시간(User Time)만을 정확하게 측정할 수 있다. 이러한 변화는 을 가져왔다.

OpenJDK, 40줄 수정으로 400배 성능 향상!

/proc 기반 CPU 시간 측정 방식의 문제점

clock_gettime()을 활용한 성능 개선