네이버 검색, AIB 도입 후 LCP 대신 TTFT 도입
네이버 통합검색에 AI 기반 요약 기능(AIB) 도입 후 LCP(Largest Contentful Paint) 지표가 악화됨
AIB의 채팅 UI 구조와 렌더링 방식이 LCP 측정에 부정적 영향을 미침을 확인
DOM 재구성 로직과 어절 단위 렌더링으로 인해 LCP가 실제 사용자 경험을 제대로 반영하지 못하는 문제 발생
LCP 대신 TTFT(Time to First Token)를 새로운 핵심 성능 지표로 도입하여 사용자 체감 성능을 측정할 계획
AIB 채팅 UI의 렌더링 구조와 LCP 측정의 문제점
본문에 따르면 네이버 통합검색의 AIB는 채팅 UI(Chatting UI)를 사용하여 텍스트를 어절 단위로 점진적으로 렌더링한다. 이러한 구조는 사용자에게 자연스러운 대화 흐름을 제공하지만, LCP 측정 시 DOM 재구성(DOM Re-construction)으로 인해 실제 렌더링 시점과 LCP 측정 시점 간의 불일치를 발생시킨다.
하이라이트 기능: 텍스트 애니메이션 완료 후 DOM 재구성으로 LCP renderTime 지연
어절 단위 렌더링: LCP 후보가 분산되어, 의미 없는 요소(Less Meaningful Element)가 LCP로 선택될 수 있음
Chromium 렌더링 파이프라인: paint invalidation(Paint Invalidation)으로 인해 LCP renderTime이 지속적으로 갱신되어 왜곡 발생
결과적으로 AIB 영역의 LCP는 실제 사용자 경험을 제대로 반영하지 못하는 문제가 발생한다.
AIB 도입 전후 LCP 지표 변화 분석
글에 따르면 AIB 도입 이후 네이버 통합검색의 LCP p95가 악화되었으며, AIB 노출량 증가와 LCP 악화 시점이 유사한 패턴을 보인다. AIB 도입 전에는 LCP p95가 2.5초 이하를 유지했으나, 도입 후에는 목표치를 상회하는 3.1초 수준으로 증가했다.
Good 구간(LCP < 2.5초) 비율 감소: AIB가 전체 LCP 분포의 tail 영역에 영향
구글 AI Overview 사례: 유사한 UI 패턴에서 LCP 악화 현상 발생
렌더링 단위 및 애니메이션 방식 차이: 네이버 AIB는 텍스트를 어절 단위로 쪼개 점진적으로 표시하고, 노출 애니메이션을 적극적으로 사용
AIB 영역을 제외한 LCP 분포는 Good 비율 96%를 유지하며, 기본 성능 품질(Basic Performance Quality)은 안정적인 것으로 분석된다.
LCP vs TTFT: 성능 지표의 재해석
본문에서는 LCP가 채팅 UI의 사용자 경험을 제대로 반영하지 못하는 문제를 지적하며, TTFT(Time to First Token)를 새로운 핵심 성능 지표로 도입할 계획임을 밝힌다. LCP는 페이지의 완전한 렌더링 시점을 측정하는 반면, TTFT는 사용자가 첫 번째 의미 있는 응답을 인지하는 시점을 측정한다.
LCP의 한계: 채팅 UI의 점진적 렌더링 특성상 LCP가 실제 사용자 체감 성능을 제대로 반영하지 못함
TTFT의 장점: 채팅 UI 환경(Chatting UI Environment)에서 사용자 경험을 더 잘 설명하는 지표
지표 해석의 중요성 강조: 최적화(Optimization) 중심에서 벗어나, 실제 사용자 경험을 예측하고 설명하기 위한 지표 해석과 분포 분석의 중요성 강조
결과적으로 UI 특성에 맞는 성능 지표를 선택하고, 지표를 다각도로 분석하는 것이 중요함을 시사한다.
Chromium 렌더링 파이프라인과 LCP 측정의 구조적 한계
글에 따르면 Chromium 기반 브라우저의 렌더링 파이프라인과 LCP 계산 방식이 채팅 UI의 점진적 렌더링 패턴과 잘 맞지 않아 LCP 측정에 왜곡이 발생한다. 특히, paint invalidation(Paint Invalidation)으로 인해 LCP renderTime이 지속적으로 갱신되는 문제가 발생한다.
paint invalidation: LCP 후보가 포함된 요소가 속한 레이어에서 발생 시 레이어가 다시 페인트되고, LCP renderTime 갱신
점진적 렌더링: 텍스트가 순차적으로 추가되는 구조에서, 이미 표시된 콘텐츠도 반복적으로 다시 그려짐
구조적 한계: 특정 구현의 버그가 아닌, 채팅 UI와 LCP 설계 간의 근본적인 문제
결론적으로, 채팅 UI와 같은 스트리밍·점진적 렌더링 UI는 LCP의 설계 가정과 맞지 않아, LCP 측정에 구조적인 한계가 존재한다.
AIB 성능 개선을 위한 향후 과제
본문에서는 AIB 영역의 성능을 측정·관리하는 독립적인 기준 도입을 통해 LCP 왜곡 문제를 해결하고, 사용자 체감 성능과 성능 지표 간의 일관성을 확보하고자 한다. 이는 단순히 특정 지표를 보정하는 것이 아니라, UI 특성에 맞는 측정 체계를 재정립하려는 시도이다.
TTFT 도입: AIB 영역의 핵심 성능 지표로 TTFT를 도입하여 사용자 경험 측정
지표 세분화: LCP Good 구간을 세분화하여 사용자 체감 성능을 정밀하게 분석
렌더링 구조 개선: 렌더링 구조 개선을 통해 LCP 왜곡 문제 해결
결과적으로, 네이버 검색은 AIB와 같은 새로운 UI 패턴에 대한 지속적인 관찰과 지표 설계를 통해 사용자 체감 성능을 향상시키고, 성능 측정·관리 체계를 고도화해 나갈 계획이다.