삼성계정, AI 기반 Multi-Agent로 보안 위협 잡다!
삼성계정 서비스는 20억 사용자 대상, 초당 270만 트래픽을 처리하며, AI SecOps 시스템 구축을 통해 지능화된 보안 위협에 대응
AWS WAF를 1차 방어선으로 활용, AI 에이전트를 통해 로그 분석 자동화 및 규칙 효과 검증을 수행
Text-to-SQL 에이전트에서 시작하여 Multi-Agent 아키텍처로 진화, 각 에이전트의 역할 분담을 통해 분석 정확도 향상
실제 Brute Force 공격 및 스캐닝 공격 탐지 사례를 통해 AI SecOps 시스템의 효과 입증
AI SecOps 시스템 아키텍처 심층 분석
삼성 계정 서비스는 20억 사용자 규모의 트래픽을 처리하며, 지능적인 보안 위협에 대응하기 위해 AI SecOps 시스템을 구축했다. 초기에는 Text-to-SQL 에이전트를 활용하여 AWS WAF 로그를 분석했지만, 복잡한 분석 요구사항을 충족하기 위해 Multi-Agent 아키텍처로 전환했다.
Orchestrator: 분석 전략 수립 및 워크플로우 제어
Actor: 실제 데이터 조회 및 분석 수행
Supervisor: 결과 검증 및 재작업 요청
Reporter: 최종 보안 리포트 생성
이러한 Multi-Agent 아키텍처는 분석 정확도 향상(Hallucination 최소화), 시스템 처리 속도 및 운영 효율 개선을 가져왔다. 각 에이전트의 역할 분담을 통해 단일 책임 원칙(Single Responsibility Principle)을 준수하고, RAG(Retrieval-Augmented Generation) 툴을 활용하여 정보의 정확성을 높였다.
AWS WAF 로그 분석 파이프라인 구축
AI 에이전트가 WAF 로그를 효과적으로 분석하기 위해, 삼성 계정 서비스는 데이터 파이프라인(Data Pipeline)을 구축했다. 이 파이프라인은 AWS WAF에서 생성된 로그를 S3에 저장하고, AWS Glue Crawler를 통해 스키마를 분석하여 Data Catalog에 등록한다. 이후 Amazon Athena 또는 Amazon Redshift를 사용하여 SQL 쿼리를 통해 로그를 조회할 수 있다.
S3: 대용량 로그의 비용 효율적인 저장소
AWS Glue Crawler: 스키마 자동 추론 및 Data Catalog 등록
Amazon Athena/Redshift: SQL 쿼리를 통한 로그 조회
이러한 파이프라인은 AI 에이전트가 자연어 질문을 SQL로 변환하여 WAF 로그를 검색할 수 있는 기반을 마련했으며, 데이터 격리 아키텍처(Data Isolation Architecture)를 통해 보안성을 강화했다.
Text-to-SQL 에이전트 성능 개선 전략
초기 Text-to-SQL 에이전트는 Amazon Bedrock Knowledge Bases를 활용하여 구축되었지만, 복잡한 쿼리에서 부정확한 SQL을 생성하는 문제가 발생했다. 이를 해결하기 위해, 삼성 계정 서비스는 Query Configuration 기능을 활용하여 성능을 개선했다.
Schema Description 최적화: LLM이 각 필드의 역할과 의미를 명확히 이해하도록 상세 설명 추가
Curated Query 도입: 자주 사용되는 질의와 검증된 SQL 쿼리 쌍을 예시로 등록
이러한 개선을 통해 LLM은 데이터의 의미와 구조적 맥락을 이해하고, 구문 오류 없이 정확한 문법과 로직으로 SQL을 생성할 수 있게 되었다. 특히, AI 환각(Hallucination)을 줄이고 분석 정확도를 높이는 데 기여했다.
Multi-Agent 아키텍처의 장점과 Strands Agents 도입
단일 에이전트(Single Agent)는 방대한 컨텍스트 처리로 인한 토큰 과소비 및 할루시네이션(Hallucination) 빈도 증가, 통찰력 부족 등의 한계가 있었다. 이를 극복하기 위해 삼성 계정 서비스는 Strands Agents를 도입하여 Multi-Agent 아키텍처로 전환했다. Strands Agents는 그래프 기반의 정교한 태스크 제어와 병렬 실행, Python 환경의 유연한 Tool 연동 기능을 제공한다.
병렬 처리: 다수 에이전트가 병렬로 분석을 진행하여 실행 속도 개선
피드백 루프: 결과 품질이 기준에 미달할 경우 재작업 요청
역할 분리: 각 에이전트는 하나의 명확한 책임만 가짐
이러한 Multi-Agent 아키텍처는 시스템 처리 속도 및 운영 효율 개선에 기여했으며, 분석 정확도 향상(Hallucination 최소화)을 달성했다.
실제 공격 탐지 사례 분석
AI SecOps 시스템은 실제 운영 환경에서 다양한 보안 위협을 탐지하는 데 성공했다. Brute Force 공격과 WordPress 공격을 탐지한 사례에서는, 20% 이상으로 급증한 요청 실패율과 백엔드 리소스 사용량 급증을 AI 에이전트가 분석하여, 단순 트래픽 증가가 아닌 복합 공격임을 밝혀냈다. 또한, Scanning Attack with DDoS 사례에서는, AI 에이전트가 랜덤 문자열을 이용한 체계적인 스캐닝 패턴을 정확히 포착하고 공격 의도까지 파악하여, 보안팀이 적절한 대응을 할 수 있도록 지원했다.
Brute Force 공격: WordPress 관리자 페이지 대상 무차별 대입 공격 탐지
Scanning Attack with DDoS: 내부 API 경로에 대한 정찰 행위 탐지
이러한 사례들은 AI SecOps 시스템이 실시간 위협 대응에 효과적임을 입증한다.